Title: | Simple statistic package |
---|---|
Description: | Một gói lệnh thống kê đơn giản và dễ hiểu. |
Authors: | Vu Ngọc Bình [aut, cre] (no Id) |
Maintainer: | Vu Ngọc Bình <[email protected]> |
License: | `use_mit_license()` |
Version: | 3.2.1 |
Built: | 2025-03-15 05:13:06 UTC |
Source: | https://github.com/vungocbinh2009/thongke |
Hàm này tính tất cả các giá trị tổng giữa x và y
calculate_sum(x, y, silent = FALSE)
calculate_sum(x, y, silent = FALSE)
Hàm kiểm tra điều kiện để áp dụng công thức tính ước lượng khoảng cho tỷ lệ
check_estimate_prop(n, f)
check_estimate_prop(n, f)
Hàm kiểm tra điều kiện để áp dụng bài toán so sánh 2 tỷ lệ
check_test_2_prop(n1, n2, f1, f2)
check_test_2_prop(n1, n2, f1, f2)
Hàm kiểm tra điều kiện để áp dụng bài toán kiểm định tính độc lập
check_test_independent(matrix)
check_test_independent(matrix)
Hàm kiểm tra điều kiện để áp dụng bài toán so sánh nhiều tỷ lệ
check_test_k_prop(m_i, n_i)
check_test_k_prop(m_i, n_i)
Hàm kiểm tra điều kiện để áp dụng bài toán kiểm định giả thiết cho tỷ lệ
check_test_prop(n, p0)
check_test_prop(n, p0)
Hàm này tính và trả về giá trị hệ số tương quan.
correlation(x, y, silent = FALSE)
correlation(x, y, silent = FALSE)
Hàm này tạo dữ liệu giả theo phân bố chuẩn từ min đến max Hàm sẽ in ra bảng phân bố tần số ghép lớp, theo các giá trị cut cho trước Hàm cũng trả về dữ liệu dưới dạng ghép lớp (điểm giữa của các khoảng) Lưu ý: dữ liệu chỉ cho giá trị mean và sd gần đúng và không bằng giá trị mean và sd truyền vào hàm
data_simulate_continuous( n, mean, sd, min, max, size, silent = FALSE, simplify = FALSE )
data_simulate_continuous( n, mean, sd, min, max, size, silent = FALSE, simplify = FALSE )
Hàm này tạo dữ liệu giả theo phân bố chuẩn từ min đến max Hàm sẽ in ra bảng phân bố tần số và trả về dữ liệu được hàm tạo ra. Lưu ý: dữ liệu chỉ cho giá trị mean và sd gần đúng và không bằng giá trị mean và sd truyền vào hàm
data_simulate_discrete( n, mean, sd, min, max, round_digits = 0, silent = FALSE, simplify = FALSE )
data_simulate_discrete( n, mean, sd, min, max, round_digits = 0, silent = FALSE, simplify = FALSE )
Hàm này tạo dữ liệu giả để xây dựng bài toán hồi quy tuyến tính đơn Lưu ý: Các hệ số hồi quy tuyến tính truyền vào không phải các hệ số hồi quy tuyến tính cuối cùng Hàm này trả về các giá trị x, y, có thể dùng dưới dạng data$x, data$y
data_simulate_regression( n, min_x, max_x, b0, b1, sd_eps, round_digits, silent = FALSE, simplify = FALSE )
data_simulate_regression( n, min_x, max_x, b0, b1, sd_eps, round_digits, silent = FALSE, simplify = FALSE )
Hàm này dùng để tạo dữ liệu cho bài toán kiểm định sự phù hợp của k tỷ lệ
data_simulate_test_goodness_of_fit(expected, silent = FALSE, simplify = FALSE)
data_simulate_test_goodness_of_fit(expected, silent = FALSE, simplify = FALSE)
Hàm này dùng để tạo dữ liệu cho bài toán kiểm định tính độc lập
data_simulate_test_independent( expected_matrix, silent = FALSE, simplify = FALSE )
data_simulate_test_independent( expected_matrix, silent = FALSE, simplify = FALSE )
Hàm này dùng để tạo dữ liệu cho bài toán so sánh k tỷ lệ
data_simulate_test_k_prop( expected_m_i, expected_l_i, silent = FALSE, simplify = FALSE )
data_simulate_test_k_prop( expected_m_i, expected_l_i, silent = FALSE, simplify = FALSE )
Hàm này dùng để tính ước lượng khoảng cho giá trị trung bình, dùng phân bố chuẩn tắc Hàm trả về các giá trị z_alpha, z_alpha_div_2 (z_alpha/2), bottom, top (khoảng tin cậy 2 phía), min (khoảng tin cậy nhỏ nhất), max (khoảng tin cậy lớn nhất) alternative có 3 chế độ: two_sided, min và max tương ứng với khoảng tin cậy hai phía, lớn nhất và nhả nhất
estimate_mean_norm( n, mean, sigma, alpha, alternative = "two_sided", silent = FALSE )
estimate_mean_norm( n, mean, sigma, alpha, alternative = "two_sided", silent = FALSE )
Hàm này dùng để tính ước lượng khoảng cho giá trị trung bình, dùng phân bố Student Hàm trả về các giá trị z_alpha, z_alpha_div_2 (z_alpha/2), bottom, top (khoảng tin cậy 2 phía), min (khoảng tin cậy nhỏ nhất), max (khoảng tin cậy lớn nhất) alternative có 3 chế độ: two_sided, min và max tương ứng với khoảng tin cậy hai phía, lớn nhất và nhả nhất
estimate_mean_t(n, mean, s, alpha, alternative = "two_sided", silent = FALSE)
estimate_mean_t(n, mean, s, alpha, alternative = "two_sided", silent = FALSE)
Hàm này ước lượng khoảng cho tỷ lệ Hàm trả về các giá trị z_alpha, z_alpha_div_2 (z_alpha/2), bottom, top (khoảng tin cậy 2 phía), min (khoảng tin cậy nhỏ nhất), max (khoảng tin cậy lớn nhất) alternative có 3 chế độ: two_sided, min và max tương ứng với khoảng tin cậy hai phía, lớn nhất và nhả nhất
estimate_prop(n, f, alpha, alternative = "two_sided", silent = FALSE)
estimate_prop(n, f, alpha, alternative = "two_sided", silent = FALSE)
Hàm này ước lượng khoảng cho phương sai. Hàm trả về các giá trị chi_sq_1, chi_sq_2, chi_sq_1_2 (chisq(1-a/2)), chi_sq_2_2 (chisq(a/2)), bottom, top, min, max. alternative có 3 chế độ: two_sided, min và max tương ứng với khoảng tin cậy hai phía, lớn nhất và nhả nhất
estimate_var(n, s, alpha, alternative = "two_sided", silent = FALSE)
estimate_var(n, s, alpha, alternative = "two_sided", silent = FALSE)
Hàm này có thể dùng để truyền trực tiếp giá trị z_alpha vào các hàm, từ đó thu được kết quả sát với kết quả thu được khi tính toán bằng tay hơn.
get_alpha(z_alpha, two_side = TRUE)
get_alpha(z_alpha, two_side = TRUE)
Hàm này xây dựng cut_vector cho hàm data_simulate_regression
get_cut_vector(min, max, size)
get_cut_vector(min, max, size)
Hàm này thực hiện bài toán hồi quy tuyến tính đơn và trả về các giá trị a, b (y = ax+b)
linear_regression(x, y, silent = FALSE)
linear_regression(x, y, silent = FALSE)
Hàm này thực hiện tính và trả về kết quả dự đoán giá trị trong bài toán hồi quy tuyến tính đơn.
linear_regression_predict(x, y, value, silent = FALSE)
linear_regression_predict(x, y, value, silent = FALSE)
Hàm này dùng để tạo và in bảng dataframe, sử dụng huxtable.
print_huxtable(df)
print_huxtable(df)
Hàm này có chức năng tương tự như hàm printf trong C
printf(...)
printf(...)
Hàm này xác định kích thước mẫu cho trường hợp ước lượng giá trị trung bình. Hàm trả về các giá trị z_alpha, value - kết quả của phép tính
sample_size_mean(sigma, eps, alpha, silent = FALSE)
sample_size_mean(sigma, eps, alpha, silent = FALSE)
Hàm này xác đỉnh kích thước mẫu cho trường hợp ước lượng tỷ lệ (công thức 1) Hàm trả về các giá trị z_alpha, value - kết quả của phép tính
sample_size_prop_1(f, eps, alpha, silent = FALSE)
sample_size_prop_1(f, eps, alpha, silent = FALSE)
Hàm này xác định kích thước mẫu cho trường hợp ước lượng tỷ lệ (công thức 2) Hàm trả về các giá trị z_alpha, value - kết quả của phép tính
sample_size_prop_2(eps, alpha, silent = FALSE)
sample_size_prop_2(eps, alpha, silent = FALSE)
Hàm này so sánh 2 giá trị trung bình (dùng phân bố chuẩn) Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test) và giá trị c
test_2_mean_norm( n1, n2, mean1, mean2, sigma1, sigma2, alpha, alternative = "neq", silent = FALSE )
test_2_mean_norm( n1, n2, mean1, mean2, sigma1, sigma2, alpha, alternative = "neq", silent = FALSE )
Hàm này so sánh 2 giá trị trung bình (dùng phân bố Student) Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test), giá trị c và phương sai chung s
test_2_mean_t( n1, n2, mean1, mean2, s1, s2, alpha, alternative = "neq", silent = FALSE )
test_2_mean_t( n1, n2, mean1, mean2, s1, s2, alpha, alternative = "neq", silent = FALSE )
Hàm này thực hiện so sánh 2 tỷ lệ Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test) và giá trị c và tỷ lệ chung f
test_2_prop(n1, n2, f1, f2, alpha, alternative = "neq", silent = FALSE)
test_2_prop(n1, n2, f1, f2, alpha, alternative = "neq", silent = FALSE)
Hàm này thực hiện kiểm định khi bình phương actual, expect là các vector thể hiện tần số quan sát và tần số lý thuyết Hàm trả về kết quả của test thống kê (test) và giá trị c
test_goodness_of_fit(actual, expected, alpha, silent = FALSE)
test_goodness_of_fit(actual, expected, alpha, silent = FALSE)
Hàm này thực hiện kiểm định tính độc lập của 2 dấu hiệu A và B matrix là một ma trận với các phần tử n_ij nằm trong bảng liên hợp các dấu hiệu (Contingency Table) Hàm trả về kết quả của test thống kê (test), giá trị c cùng các kết quả row_sums, col_sums và n (kích thước mẫu)
test_independent(matrix, alpha, silent = FALSE)
test_independent(matrix, alpha, silent = FALSE)
Hàm này thưc hiện so sánh k tỷ lệ. m_i, n_i là các vector thể hiện số quan sát có đặc tính A nào đó và tổng số quan sát trong các tập tổng thể. Hàm trả về kết quả của test thống kê (test), giá trị c và các giá trị m (sum_m_i), l (sum_l_i), N (sum_n_i)
test_k_prop(m_i, n_i, alpha, silent = FALSE)
test_k_prop(m_i, n_i, alpha, silent = FALSE)
Hàm này kiểm định giả thiết về gái trị trung bình, dùng phân bố chuẩn Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test) và giá trị c
test_mean_norm( n, mean, mean_0, sigma, alpha, alternative = "neq", silent = FALSE )
test_mean_norm( n, mean, mean_0, sigma, alpha, alternative = "neq", silent = FALSE )
Hàm này kiểm định giả thiết về gái trị trung bình, dùng phân bố student Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test) và giá trị c
test_mean_t(n, mean, mean_0, s, alpha, alternative = "neq", silent = FALSE)
test_mean_t(n, mean, mean_0, s, alpha, alternative = "neq", silent = FALSE)
Hàm này kiểm định giả thiết về xác suất Tham số alternative là 1 trong 3 giá trị: neq, less, greater tương ứng với 3 đối thiết. Hàm trả về kết quả của test thống kê (test) và giá trị c
test_prop(n, f, p_0, alpha, alternative = "neq", silent = FALSE)
test_prop(n, f, p_0, alpha, alternative = "neq", silent = FALSE)