sql >> Database teknologi >  >> RDS >> Mysql

Hvordan konverteres en 500GB SQL-tabel til Apache Parket?

Apache Spark kan bruges til at gøre dette:

1.load your table from mysql via jdbc
2.save it as a parquet file

Eksempel:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. Oracle pl-sql escape-tegn (for en ' )

  2. En SaaS abonnementsdatamodel

  3. Sådan fjerner du to dublerede kolonner

  4. Sådan får du mening i SQL Server Geografi Data Type