Критерий хи-квадрат: методы и примеры кода для категориального анализа данных

Тест хи-квадрат – это статистический тест, используемый для определения наличия значимой связи между двумя категориальными переменными. Он обычно используется в таких областях, как статистика, анализ данных и машинное обучение. Вот несколько методов выполнения теста хи-квадрат на разных языках программирования:

  1. Python:
from scipy.stats import chi2_contingency
# Create a contingency table
observed = [[30, 10], [20, 15]]
# Perform the chi-squared test
stat, p, dof, expected = chi2_contingency(observed)
# Print the test statistic, p-value, degrees of freedom, and expected frequencies
print("Chi-squared statistic:", stat)
print("P-value:", p)
print("Degrees of freedom:", dof)
print("Expected frequencies:", expected)
  1. R:
# Create a contingency table
observed <- matrix(c(30, 10, 20, 15), nrow = 2)
# Perform the chi-squared test
result <- chisq.test(observed)
# Print the test statistic, p-value, degrees of freedom, and expected frequencies
print("Chi-squared statistic:", result$statistic)
print("P-value:", result$p.value)
print("Degrees of freedom:", result$parameter)
print("Expected frequencies:", result$expected)
  1. Java:
import org.apache.commons.math3.stat.inference.ChiSquareTest;
// Create observed frequencies
double[] observed = {30, 10, 20, 15};
// Perform the chi-squared test
ChiSquareTest chiSquareTest = new ChiSquareTest();
double pValue = chiSquareTest.chiSquareTest(expected, observed);
// Print the p-value
System.out.println("P-value: " + pValue);

Эти примеры демонстрируют, как выполнить тест хи-квадрат с использованием популярных языков программирования, таких как Python, R и Java. Вы можете адаптировать эти фрагменты кода к своему конкретному случаю использования.