Det var en hård en!
Først den nøgne løsning:
db.test.aggregate([
{ "$match": { "user": "Hans" } },
// duplicate each document: one for "age", the other for "childs"
{ $project: { age: "$age", childs: "$childs",
data: {$literal: ["age", "childs"]}}},
{ $unwind: "$data" },
// pivot data to something like { data: "age", value: "40" }
{ $project: { data: "$data",
value: {$cond: [{$eq: ["$data", "age"]},
"$age",
"$childs"]} }},
// Group by data type, and count
{ $group: { _id: {data: "$data", value: "$value" },
count: { $sum: 1 },
value: {$first: "$value"} }},
// aggregate values in an array for each independant (type,value) pair
{ $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
// project value to the correctly name field
{ $project: { result: {$cond: [{$eq: ["$_id", "age"]},
{age: "$values" },
{childs: "$values"}]} }},
// group all data in the result array, and remove unneeded `_id` field
{ $group: { _id: null, result: { $push: "$result" }}},
{ $project: { _id: 0, result: 1}}
])
Producerer:
{
"result" : [
{
"age" : [
{
"count" : 3,
"value" : "40"
},
{
"count" : 1,
"value" : "50"
}
]
},
{
"childs" : [
{
"count" : 1,
"value" : "1"
},
{
"count" : 3,
"value" : "2"
}
]
}
]
}
Og nu, for nogle forklaringer:
Et af de største problemer her er, at hvert indgående dokument skal være en del af to forskellige summer. Jeg løste det ved at tilføje en bogstavelig matrix ["age", "childs"]
til dine dokumenter og derefter afvikle dem ved det array. På den måde vil hvert dokument blive præsenteret to gange i det senere stadium.
Når det er gjort, ændrer jeg datarepræsentationen til noget meget mere overskueligt, f.eks. { data: "age", value: "40" }
for at lette behandlingen.
De følgende trin udfører dataaggregeringen i sig selv. Op til det tredje $project
trin, der vil knytte værdifelterne til den tilsvarende age
eller childs
felt.
De sidste to trin vil blot pakke de to dokumenter ind i ét og fjerne det unødvendige _id
felt.
Pfff!