sql >> Database teknologi >  >> NoSQL >> MongoDB

Kan ikke udfylde en stor del af data til mongodb ved hjælp af Node.js

Som Robbie sagde, streams er vejen at gå med dette. fs.createReadStream() skal bruges i stedet for .readFileSync() . Jeg vil starte med at oprette en linjelæser, der tager en sti og hvilken streng/regex du vil opdele på:

linereader.js

var fs = require("fs");
var util = require("util");
var EventEmitter = require("events").EventEmitter;

function LineReader(path, splitOn) {

    var readStream = fs.createReadStream(path);
    var self = this;
    var lineNum = 0;
    var buff = ""
    var chunk;

    readStream.on("readable", function() {

        while( (chunk = readStream.read(100)) !== null) {
            buff += chunk.toString();
            var lines = buff.split(splitOn);

            for (var i = 0; i < lines.length - 1; i++) {
                self.emit("line",lines[i]);
                lineNum += 1;
            }
            buff = lines[lines.length - 1];
        }
    });
    readStream.on("close", function() {
        self.emit("line", buff);
        self.emit("close")
    });
    readStream.on("error", function(err) {
        self.emit("error", err);
    })
}
util.inherits(LineReader, EventEmitter);
module.exports = LineReader;

Dette vil læse en tekstfil og udsende "linje"-begivenheder for hver læst linje, så du vil ikke have dem alle i hukommelsen på én gang. Brug derefter async-pakken (eller hvilken som helst async-løkke, du vil bruge), gå gennem filerne, der indsætter hvert dokument:

app.js

var LineReader = require("./linereader.js");
var async = require("async");

var paths = ["./text1.txt", "./text2.txt", "./path1/text3.txt"];
var reader;

async.eachSeries(paths, function(path, callback) {

    reader = new LineReader(path, /\n/g);

    reader.on("line", function(line) {
        var doc = turnTextIntoObject(line);
        db.collection("mycollection").insert(doc);
    })
    reader.on("close", callback);
    reader.on("error", callback);
}, function(err) {
    // handle error and finish;
})


  1. Scala-serialiseringsundtagelse med enumerationsværdi

  2. Opdater dobbelt indlejret array mongodb

  3. MongoDB $sinh

  4. Hvordan genopretter man forbindelse til MongoDB ved hjælp af C++ driver?