sql >> Database teknologi >  >> NoSQL >> MongoDB

Hvordan fjerner jeg de tomme tweets ved hjælp af filter() i pyspark?

Hvis dine data som denne

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

du kan bruge len(x) som filterbetingelsen:

tweets.filter(lambda x: len(x) > 0).count()



  1. Sådan kontrolleres en kolonnes datatype i SQL

  2. Polygon overlappende procentdel

  3. 2 Helm Charts med delt Redis-afhængighed

  4. Sådan gentager du objekter i Collection Meteor Mongo