Создание временной таблицы в PySpark позволяет хранить данные и манипулировать ими во временном контексте. В этой статье блога я расскажу вам о различных методах создания временной таблицы в PySpark, а также приведу примеры кода. Итак, начнем!
Метод 1: использование метода createOrReplaceTempView
# Import the necessary libraries
from pyspark.sql import SparkSession
# Create a SparkSession
spark = SparkSession.builder.getOrCreate()
# Create a DataFrame
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# Create a temporary view
df.createOrReplaceTempView("temp_table")
Метод 2: использование метода registerTempTable
# Import the necessary libraries
from pyspark.sql import SparkSession
# Create a SparkSession
spark = SparkSession.builder.getOrCreate()
# Create a DataFrame
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# Register the DataFrame as a temporary table
df.registerTempTable("temp_table")
Метод 3: использование метода createTempView
# Import the necessary libraries
from pyspark.sql import SparkSession
# Create a SparkSession
spark = SparkSession.builder.getOrCreate()
# Create a DataFrame
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# Create a temporary view
df.createTempView("temp_table")
Метод 4. Использование метода createGlobalTempView
# Import the necessary libraries
from pyspark.sql import SparkSession
# Create a SparkSession
spark = SparkSession.builder.getOrCreate()
# Create a DataFrame
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# Create a global temporary view
df.createGlobalTempView("temp_table")
Метод 5: использование метода createOrReplaceGlobalTempView
# Import the necessary libraries
from pyspark.sql import SparkSession
# Create a SparkSession
spark = SparkSession.builder.getOrCreate()
# Create a DataFrame
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# Create or replace a global temporary view
df.createOrReplaceGlobalTempView("temp_table")
Вот некоторые методы, которые можно использовать для создания временной таблицы в PySpark. Каждый метод предоставляет свой способ создания временных таблиц и управления ими в приложении Spark.