sql >> Database teknologi >  >> NoSQL >> MongoDB

Spark Mongo-stik, MongoShardedPartitioner virker ikke

Beklager jose at høre, at du har et problem med stikket.

Oplysninger om partitionering kan findes på Spark-connector-dokumentationssiden a> . Indsend venligst en billet i Docs jira-projektet hvis du føler noget mangler eller er uklart, kan det virkelig hjælpe fremtidige brugere!

Standardpartitioneringen er en tynd indpakning omkring MongoSamplePartitioner . Det opdeler en samling i størrelsespartitioner baseret på statistisk stikprøve af samlingen.

MongoShardedPartitioner bruger shardKey at generere partitionerne. Som standard vil den bruge _id som nøglen. Du skal muligvis konfigurere denne værdi.

Bemærk: Hashed shardkeys er ikke understøttet af MongoShardedPartitioner da der i øjeblikket ikke er nogen måde at forespørge en samling mod den hash-værdi - så når den henter partitioner, vil den ikke returnere resultater. Jeg har tilføjet DOCS-12345 for at opdatere dokumentationen.

Det ser ud til, at der er et problem i din opsætning, hvor MongoShardedPartitioner undlader at opdele samlingen som forventet og returnerer 0 resultater. Skemaslutning vil stadig fungere på grund af, hvordan den forespørger samlingen. Hvis det ikke er et config / hashed shardkey-problem, skal du indsende en fejl i Spark jira-projektet og jeg kan hjælpe med at identificere årsagen og frigive en rettelse til dig.




  1. Fordele og ulemper ved MongoDB?

  2. mongodb - $lookup pipeline ved hjælp af COLLSCAN i stedet for indeks

  3. Hybrid Cloud vs Full Public Cloud - Fordele og ulemper

  4. Mongo - forespørgsel, indlejret dokument matcher ikke undtagen punktnotation