sql >> Database teknologi >  >> NoSQL >> MongoDB

Indsættelse af nye felter(kolonner) til mongoDB med pandaer

Metoden du skal bruge er update_one() med upsert=True i en løkke; du kan ikke bruge insert_many() af to grunde; for det første indsætter du ikke altid; nogle gange opdaterer du; for det andet update_many() (og insert_many() ) kun arbejde på et enkelt filter; i dit tilfælde er hvert filter forskelligt, da hver opdatering vedrører et andet tidspunkt.

Dette er en generisk løsning, der kombinerer datarammer (df_a , df_b i dette tilfælde - du kan have så mange du vil) på den måde, du har brug for. Den bruger iterrows for at få hver række i datarammen, filtrerer du på datoen og indstiller værdierne til dem i datarammen. $set operatør vil tilsidesætte værdier, hvis de allerede er der, og indstille dem, hvis de ikke er indstillet. upsert=True udfører en indsættelse, hvis der ikke er noget match på datoen.

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

Fuldt udført eksempel:

from pymongo import MongoClient
from pprint import pprint
import datetime
import pandas as pd

# Sample data setup

db = MongoClient()['mydatabase']

data_a = [[datetime.datetime(2017, 5, 19, 21, 20), 96, 8, 98],
          [datetime.datetime(2017, 5, 19, 21, 21), 95, 8, 97],
          [datetime.datetime(2017, 5, 19, 21, 22), 95, 8, 97]]

df_a = pd.DataFrame(data_a, columns=['date', 'std_500_1000window', 'std_50_100window', 'std_50_2000window'])

data_b = [[datetime.datetime(2017, 5, 19, 21, 20), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 21), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 22), 98, 9, 10]]

df_b = pd.DataFrame(data_b, columns=['date', 'std_50_3000window', 'std_50_300window', 'std_50_500window'])

# Perform the upserts

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

# Print the results

for record in db.mycollection.find():
    pprint(record)

Resultat:

{'_id': ObjectId('5f0ae909df5531ac655ce528'),
 'date': datetime.datetime(2017, 5, 19, 21, 20),
 'std_500_1000window': 96,
 'std_50_100window': 8,
 'std_50_2000window': 98,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52a'),
 'date': datetime.datetime(2017, 5, 19, 21, 21),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52c'),
 'date': datetime.datetime(2017, 5, 19, 21, 22),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}



  1. Redis-taster funktion til match med flere mønstre

  2. har min meteor-app brug for både MONGO_OPLOG_URL og MONGO_URL

  3. returdokument med seneste underdokument kun i mongodb-aggregat

  4. Brug af mongodb til at lagre intradag-egenkapitaldata