Phân tích nhân tố khám phá EFA trong SPSS: Hướng dẫn chi tiết từng bước 2025

Chi tiết - Phân tích nhân tố khám phá EFA trong SPSS: Hướng dẫn chi tiết từng bước 2025

  • Website chính thức của MOSL hiện đang trong quá trình bảo trì Sản phẩm và thanh toán

  • Dịch vụ nghiên cứu vẫn hoạt động bình thường

Trang chủ/Kiến thức nghiên cứu/Dữ liệu bảng (Panel Data)/Phân tích nhân tố khám phá EFA trong SPSS: Hướng dẫn chi tiết từng bước 2025

Phân tích nhân tố khám phá EFA trong SPSS: Hướng dẫn chi tiết từng bước 2025

Hãy đánh giá bài viết nhé!

Bạn có từng cảm thấy bối rối trước một bảng dữ liệu khảo sát với hàng chục biến quan sát? Nghiên cứu thang đo hài lòng khách hàng với 24 biến, hay thang đo chất lượng dịch vụ với 18 câu hỏi – tất cả những con số này có thể khiến bạn hoang mang không biết bắt đầu từ đâu.

Phân tích nhân tố khám phá (EFA) chính là “chìa khóa vàng” giúp bạn rút gọn và khám phá cấu trúc tiềm ẩn của thang đo. Trong nghiên cứu thực tế, EFA đã giúp một sinh viên kinh tế rút gọn 24 biến đo lường hài lòng khách hàng thành 4 nhân tố chính, với tổng phương sai giải thích 68,7% và KMO = 0.854. Một ví dụ khác cho thấy thang đo chất lượng dịch vụ giáo dục từ 18 biến đã được rút gọn thành 3 nhân tố có ý nghĩa, tiết kiệm 83% thời gian phân tích so với phương pháp truyền thống.

Bài viết này sẽ hướng dẫn bạn thực hiện EFA từng bước một cách chi tiết trên SPSS phiên bản mới nhất 2025. Chúng ta sẽ đi qua những tiêu chí EFA cơ bản mà không phải ai cũng làm đúng: KMO và Bartlett Test, xử lý factor loading < 0.5, và cách giải thích phần trăm phương sai tích lũy.

Đặc biệt, nội dung sẽ đề cập những kỹ thuật nâng cao thường bị bỏ qua: xử lý cross-loading, phân biệt EFA và CFA, ứng dụng phương pháp xoay Oblimin cho các nhân tố tương quan, và kỹ thuật bootstrap validation. Tất cả sẽ được minh họa bằng case study thực tế và hình ảnh cụ thể từ SPSS 2025.

Hình minh họa

Phân tích nhân tố khám phá EFA là gì?

EFA (Exploratory Factor Analysis) là một kỹ thuật thống kê đa biến được sử dụng để khám phá cấu trúc tiềm ẩn của một tập hợp biến quan sát. Khác với phân tích xác nhận (CFA), EFA không dựa trên lý thuyết có sẵn mà tìm kiếm các mẫu hình ẩn trong dữ liệu.

Mục đích chính của EFA bao gồm ba khía cạnh quan trọng:

Rút gọn dữ liệu hiệu quả: EFA giúp giảm số lượng biến từ 20-30 biến xuống 3-5 nhân tố có ý nghĩa. Một nghiên cứu về động lực học tập của sinh viên đã rút gọn 22 biến quan sát thành 4 nhân tố: động lực nội tại, động lực ngoại tại, áp lực học tập và hỗ trợ gia đình.

Kiểm định tính hợp lệ thang đo: EFA xác minh xem các biến quan sát có thực sự đo lường cùng một khái niệm hay không. Trong nghiên cứu marketing, EFA đã phát hiện thang đo sự hài lòng khách hàng ban đầu có 6 nhân tố, nhưng sau khi loại bỏ 3 biến có factor loading thấp, chỉ còn lại 4 nhân tố vững chắc.

Chuẩn bị cho phân tích nâng cao: Kết quả EFA là nền tảng cho phân tích hồi quy, SEM (Structural Equation Modeling) và các phương pháp phân tích phức tạp khác.

Vị trí của EFA trong quy trình nghiên cứu

EFA được thực hiện sau bước thu thập dữ liệu và kiểm tra độ tin cậy Cronbach’s Alpha, trước khi tiến hành các phân tích sâu hơn. Lợi ích cốt lõi của EFA:

  • Giảm thiểu hiện tượng đa cộng tuyến trong mô hình hồi quy
  • Tăng khả năng giải thích và hiểu rõ dữ liệu
  • Tiết kiệm thời gian phân tích và báo cáo kết quả
  • Cải thiện tính tin cậy của các phân tích tiếp theo

MOSL đã hỗ trợ hơn 200 nghiên cứu áp dụng EFA thành công, với 95% dự án đạt được cấu trúc nhân tố ổn định và có ý nghĩa thống kê.

So sánh EFA với các phương pháp liên quan

EFA khác với CFA (Confirmatory Factor Analysis) ở chỗ EFA khám phá còn CFA kiểm định. PCA (Principal Component Analysis) tập trung vào giảm chiều dữ liệu, trong khi EFA tìm kiếm cấu trúc nhân tố tiềm ẩn có ý nghĩa thống kê.

Điều kiện và giả định cần thiết trước khi thực hiện EFA

Trước khi bắt đầu phân tích EFA, dữ liệu của bạn cần thỏa mãn một số điều kiện quan trọng. Việc bỏ qua các điều kiện này sẽ dẫn đến kết quả không đáng tin cậy.

Yêu cầu về kích thước mẫu và chất lượng dữ liệu

Quy tắc kích thước mẫu: Áp dụng tỷ lệ 5:1 hoặc lý tưởng là 10:1 giữa số quan sát và số biến. Với 20 biến quan sát, bạn cần tối thiểu 100 mẫu, lý tưởng là 200+ mẫu. Một nghiên cứu thực tế về thang đo stress học tập với 15 biến đã sử dụng 180 sinh viên, cho kết quả EFA ổn định và đáng tin cậy.

Kiểm tra dữ liệu thiếu: Dữ liệu missing không nên vượt quá 5% cho mỗi biến. SPSS cung cấp các phương pháp xử lý như listwise deletion hoặc mean substitution. Tuy nhiên, phương pháp Multiple Imputation thường cho kết quả tốt hơn.

Phát hiện outliers: Sử dụng Z-score (giá trị tuyệt đối > 3.29) hoặc Mahalanobis Distance để xác định giá trị ngoại lai. Trong một research về hành vi tiêu dùng, việc loại bỏ 8 outliers đã cải thiện KMO từ 0.65 lên 0.78.

Kiểm tra tính phù hợp của ma trận tương quan

Dữ liệu phù hợp cho EFA phải có mối tương quan đủ mạnh giữa các biến:

Tiêu chí Giá trị yêu cầu Ý nghĩa
Kaiser-Meyer-Olkin (KMO) ≥ 0.6 (tốt ≥ 0.7) Độ thích hợp dữ liệu cho EFA
Bartlett’s Test p < 0.05 Ma trận tương quan khác ma trận đơn vị
Anti-image correlation diagonal > 0.5 Mỗi biến phù hợp cho phân tích
Determinant correlation matrix > 0.00001 Tránh hiện tượng đa cộng tuyến

Giả định phân phối chuẩn: Mặc dù EFA tương đối robust với vi phạm tính chuẩn, nhưng phân phối quá lệch có thể ảnh hưởng đến kết quả. Kiểm tra skewness và kurtosis, với giá trị tuyệt đối không vượt quá 2.0 cho skewness và 7.0 cho kurtosis.

Chuẩn bị và kiểm tra dữ liệu cho phân tích EFA

Việc chuẩn bị dữ liệu kỹ lưỡng là nền tảng cho EFA thành công. Bước này quyết định 70% chất lượng kết quả cuối cùng.

Bước 1: Làm sạch và mã hóa dữ liệu

Kiểm tra tính nhất quán: Đảm bảo tất cả biến đều sử dụng cùng thang đo (ví dụ: Likert 5 điểm). Trong một nghiên cứu về thái độ học tập, việc phát hiện một biến sử dụng thang 7 điểm trong khi 19 biến khác dùng thang 5 điểm đã tránh được sai sót nghiêm trọng.

Xử lý biến ngược (reverse coding): Một số biến có thể được đặt câu hỏi theo hướng ngược lại. Ví dụ, trong thang đo stress: “Tôi cảm thấy thư giãn” cần được mã hóa ngược so với “Tôi cảm thấy căng thẳng”. SPSS cho phép tạo biến mới bằng công thức: NewVariable = (MaximumScale + 1) – Old_Variable.

Loại bỏ biến không phù hợp: Biến có quá nhiều giá trị missing (>15%) hoặc có phân phối quá lệch nên được loại bỏ trước khi phân tích.

Bước 2: Kiểm tra độ tin cậy Cronbach’s Alpha

Trước khi tiến hành EFA, thực hiện kiểm định Cronbach’s Alpha để đánh giá độ tin cậy của thang đo. Alpha ≥ 0.7 cho thấy thang đo có độ tin cậy chấp nhận được.

Phân tích item-to-total correlation: Biến có correlation với tổng thang đo < 0.3 nên được xem xét loại bỏ. Điều này giúp cải thiện độ tin cậy và chuẩn bị cho EFA tốt hơn.

Bước 3: Thực hiện các kiểm định tiên quyết

Kiểm tra linearity: Mối quan hệ tuyến tính giữa các biến là giả định quan trọng. Sử dụng scatter plots hoặc correlation matrix để kiểm tra.

Đánh giá multicollinearity: Correlation giữa hai biến không nên vượt quá 0.9. Nếu có, cần xem xét loại bỏ một trong hai biến tương quan quá cao.

Test for sphericity: Bartlett’s Test of Sphericity có ý nghĩa thống kê (p < 0.05) chứng minh ma trận tương quan khác biệt có ý nghĩa so với ma trận đơn vị, điều này cần thiết cho EFA.

Việc chuẩn bị dữ liệu tỉ mỉ này đã giúp một nghiên cứu về chất lượng dịch vụ ngân hàng cải thiện KMO từ 0.58 (không đạt) lên 0.76 (tốt), đảm bảo kết quả EFA đáng tin cậy.

Quy trình thực hiện EFA từng bước trong SPSS 2025

SPSS 2025 cung cấp giao diện trực quan và nhiều tùy chọn nâng cao cho phân tích EFA. Hãy cùng thực hiện từng bước một cách chi tiết.

Bước 1: Truy cập menu Factor Analysis trong SPSS

Mở SPSS và load dữ liệu của bạn. Điều hướng theo thứ tự: Analyze → Dimension Reduction → Factor. Giao diện SPSS 2025 đã được cải tiến với thanh ribbon rõ ràng hơn, giúp việc tìm kiếm menu dễ dàng hơn.

Cửa sổ Factor Analysis sẽ hiện ra với danh sách tất cả các biến ở bên trái. Đây là nơi bạn sẽ cấu hình toàn bộ quá trình phân tích.

Bước 2: Thiết lập biến phân tích và tùy chọn cơ bản

Chọn biến phân tích: Chuyển các biến định lượng (thang đo Likert) vào hộp “Variables”. Lưu ý không đưa biến định danh như giới tính, tuổi… vào phân tích EFA.

Selection Variable (tùy chọn): Nếu bạn muốn phân tích riêng một nhóm đối tượng (ví dụ: chỉ phân tích phản hồi của nam giới), có thể sử dụng tùy chọn này. Tuy nhiên, thường không cần thiết cho EFA cơ bản.

Bước 3: Cấu hình Descriptives – KMO và Bartlett Test

Click vào nút “Descriptives” để mở cửa sổ tùy chọn thống kê mô tả:

Statistics cần tích chọn:

  • ✓ Univariate descriptives: Thống kê mô tả từng biến
  • ✓ KMO and Bartlett’s test of sphericity: Quan trọng nhất để kiểm tra tính phù hợp
  • ✓ Anti-image: Giúp đánh giá tính phù hợp của từng biến cụ thể

Correlation Matrix:

  • ✓ Coefficients: Ma trận tương quan giữa các biến
  • ✓ Determinant: Kiểm tra đa cộng tuyến
  • ✓ Inverse: Ma trận nghịch đảo (tùy chọn cho phân tích sâu)

Bước 4: Thiết lập phương pháp Extraction

Click “Extraction” để cấu hình phương pháp rút trích nhân tố:

Method selection: Chọn “Principal Axis Factoring” thay vì Principal Components. PAF phù hợp hơn cho EFA vì tập trung vào phương sai chung (common variance) thay vì tổng phương sai.

Analyze: Chọn “Correlation matrix” cho hầu hết trường hợp. Chỉ chọn Covariance matrix khi các biến có đơn vị đo khác nhau và bạn muốn giữ nguyên sự khác biệt này.

Extract:

  • ✓ Eigenvalues over: Đặt giá trị 1.0 (Quy tắc Kaiser)
  • ✓ Number of factors: Để trống, hoặc nhập số cụ thể nếu bạn có giả thiết từ lý thuyết

Display:

  • ✓ Unrotated factor solution
  • ✓ Scree plot: Rất quan trọng để xác định số nhân tố

Bước 5: Cấu hình Rotation Method (Varimax vs Oblimin)

Click “Rotation” – đây là bước đặc biệt quan trọng:

Method:

  • Varimax: Chọn khi các nhân tố không tương quan với nhau (orthogonal rotation)
  • Direct Oblimin: Chọn khi các nhân tố có thể tương quan (oblique rotation) – thường thực tế hơn

Display:

  • ✓ Rotated solution
  • ✓ Loading plot(s): Biểu đồ trực quan hóa factor loadings

Maximum iterations: Để mặc định 25, hoặc tăng lên 50 nếu dữ liệu phức tạp.

Bước 6: Tùy chọn Options và Scores

Options:

  • Missing Values: Chọn “Exclude cases listwise” để loại bỏ toàn bộ trường hợp có giá trị thiếu
  • Coefficient Display Format: Chọn “Suppress small coefficients” với giá trị 0.3 để ẩn các factor loadings nhỏ, làm kết quả dễ đọc hơn

Scores (nếu muốn lưu factor scores):

  • ✓ Save as variables: Tạo biến mới chứa factor scores
  • Method: Regression (phổ biến nhất)

Sau khi cấu hình xong tất cả, click “OK” để chạy phân tích. SPSS sẽ tạo ra một loạt bảng kết quả chi tiết mà chúng ta sẽ phân tích ở phần tiếp theo.

Diễn giải chi tiết kết quả EFA từ SPSS

Việc đọc hiểu kết quả EFA đúng cách quyết định tính thành công của toàn bộ quá trình phân tích. Mỗi bảng kết quả đều mang thông tin quan trọng cần được giải thích cẩn thận.

Đọc và phân tích bảng KMO và Bartlett’s Test

Bảng KMO and Bartlett’s Test là bảng đầu tiên cần xem xét:

Chỉ số KMO Mức độ phù hợp Quyết định
0.90 – 1.00 Rất tốt Tiếp tục EFA
0.80 – 0.89 Tốt Tiếp tục EFA
0.70 – 0.79 Trung bình tốt Tiếp tục EFA
0.60 – 0.69 Trung bình Cân nhắc loại biến
< 0.60 Không phù hợp Không nên làm EFA

Bartlett’s Test of Sphericity cần có Sig. < 0.05. Nếu p-value > 0.05, ma trận tương quan không khác biệt đáng kể so với ma trận đơn vị, nghĩa là các biến không tương quan đủ mạnh để thực hiện EFA.

Ví dụ thực tế: Trong nghiên cứu thang đo stress học tập, KMO = 0.847 và Bartlett’s Test Sig. = 0.000, cho thấy dữ liệu rất phù hợp để tiến hành EFA.

Hiểu bảng Communalities và ý nghĩa thực tế

Bảng Communalities hiển thị tỷ lệ phương sai của mỗi biến được giải thích bởi các nhân tố:

  • Initial: Giá trị ban đầu (thường = 1.0 với Principal Components)
  • Extraction: Tỷ lệ phương sai được trích xuất bởi các nhân tố

Nguyên tắc đánh giá: Communality ≥ 0.5 được coi là chấp nhận được. Biến có communality < 0.3 nên xem xét loại bỏ vì không được đại diện tốt bởi các nhân tố.

Ví dụ minh họa: Biến “Tôi lo lắng về điểm số” có communality = 0.847, nghĩa là 84.7% phương sai của biến này được giải thích bởi các nhân tố trong mô hình.

Giải thích Total Variance Explained – Chọn số nhân tố

Bảng Total Variance Explained là kim chỉ nam để quyết định số nhân tố:

Cột quan trọng:

  • Initial Eigenvalues: Giá trị riêng ban đầu
  • % of Variance: Phần trăm phương sai giải thích bởi từng nhân tố
  • Cumulative %: Phần trăm phương sai tích lũy

Quy tắc Kaiser: Giữ lại các nhân tố có Eigenvalue > 1.0. Trong thực tế, tổng phương sai tích lũy nên đạt ≥ 60% để đảm bảo mô hình có ý nghĩa.

Ví dụ thực tế: Nghiên cứu chất lượng dịch vụ ngân hàng với 18 biến cho ra 4 nhân tố:

  • Nhân tố 1: Eigenvalue = 6.234, giải thích 34.6% phương sai
  • Nhân tố 2: Eigenvalue = 2.567, giải thích 14.3% phương sai
  • Nhân tố 3: Eigenvalue = 1.834, giải thích 10.2% phương sai
  • Nhân tố 4: Eigenvalue = 1.201, giải thích 6.7% phương sai
  • Tổng cộng: 65.8% phương sai được giải thích – kết quả chấp nhận được

Phân tích Scree Plot và Eigenvalue Rule

Scree Plot là biểu đồ đường thể hiện mối quan hệ giữa số nhân tố và eigenvalue. Điểm “khuỷu tay” (elbow) trên đồ thị thường chỉ ra số nhân tố tối ưu.

Nguyên tắc đọc Scree Plot:

  • Tìm điểm mà độ dốc thay đổi rõ rệt từ dốc sang thoai
  • Số nhân tố tối ưu thường là số điểm trước “điểm khuỷu tay”
  • Kết hợp với quy tắc Eigenvalue > 1 để đưa ra quyết định cuối cùng

Diễn giải Rotated Component Matrix – Xác định nhân tố

Bảng Rotated Component Matrix (hoặc Pattern Matrix với oblique rotation) là bảng quan trọng nhất để hiểu cấu trúc nhân tố:

Factor Loading interpretation:

  • |Loading| ≥ 0.7: Quan hệ mạnh, rất tốt
  • |Loading| 0.5-0.69: Quan hệ trung bình, chấp nhận được
  • |Loading| 0.3-0.49: Quan hệ yếu, cân nhắc loại bỏ
  • |Loading| < 0.3: Quan hệ rất yếu, nên loại bỏ

Xác định ý nghĩa nhân tố: Nhóm các biến có factor loading cao trên cùng một nhân tố, sau đó dựa vào nội dung của các biến để đặt tên cho nhân tố.

Ví dụ thực tế: Nhân tố 1 gồm các biến:

  • “Nhân viên phục vụ nhiệt tình” (Loading = 0.856)
  • “Thái độ lịch sự của nhân viên” (Loading = 0.794)
  • “Nhân viên am hiểu sản phẩm” (Loading = 0.723)

→ Đặt tên: “Chất lượng nhân viên phục vụ”

Xử lý Cross-loading: Khi một biến có factor loading > 0.3 trên nhiều nhân tố, cần xem xét:

  • Giữ lại nếu loading chính cao hơn loading phụ ít nhất 0.2
  • Loại bỏ nếu loading gần bằng nhau trên nhiều nhân tố
  • Reassign sang nhân tố phù hợp về mặt lý thuyết

Việc diễn giải chính xác các bảng kết quả này đã giúp nhiều nghiên cứu của MOSL đạt được cấu trúc nhân tố ổn định và có ý nghĩa thực tiễn cao.

Hình minh họa

Xử lý các vấn đề thường gặp trong EFA

Trong quá trình thực hiện EFA, bạn có thể gặp một số vấn đề phổ biến. Dưới đây là cách xử lý hiệu quả cho từng tình huống cụ thể.

Xử lý biến có Factor Loading thấp (<0.5)

Nguyên nhân thường gặp: Biến không đo lường cùng khái niệm với các biến khác, hoặc cách diễn đạt câu hỏi gây hiểu nhầm cho người trả lời.

Quy trình xử lý từng bước:

Bước 1: Xác định các biến có factor loading < 0.5 trên tất cả nhân tố. Trong một research về thang đo động lực học tập, biến “Tôi học vì muốn có bằng cấp” chỉ đạt loading 0.387 trên nhân tố “Động lực ngoại tại”.

Bước 2: Kiểm tra communality của biến đó. Nếu communality < 0.3, biến này không được đại diện tốt bởi mô hình nhân tố hiện tại.

Bước 3: Kiểm tra lại độ tin cậy Cronbach’s Alpha nếu loại bỏ biến này. Nếu Alpha tăng lên, việc loại bỏ là hợp lý.

Bước 4: Chạy lại EFA sau khi loại bỏ biến problematic. Thường thì KMO sẽ cải thiện và cấu trúc nhân tố trở nên rõ ràng hơn.

Giải quyết vấn đề Cross-loading

Cross-loading xảy ra khi một biến có factor loading > 0.3 trên hai hay nhiều nhân tố. Đây là tình huống phức tạp cần xử lý cẩn thận.

Tiêu chí đánh giá cross-loading:

  • Chấp nhận được: Loading chính ≥ 0.5 và cao hơn loading phụ ít nhất 0.2
  • Problematic: Loading gần bằng nhau trên nhiều nhân tố (chênh lệch < 0.15)

Chiến lược xử lý:

Phương án 1 – Reassignment: Chuyển biến sang nhân tố có loading cao nhất, nếu phù hợp về mặt lý thuyết. Ví dụ: Biến “Tôi hài lòng với thái độ phục vụ” có loading 0.542 trên nhân tố “Service Quality” và 0.389 trên nhân tố “Overall Satisfaction” → Giữ trong nhân tố “Service Quality”.

Phương án 2 – Loại bỏ: Với biến có loading gần bằng nhau trên nhiều nhân tố (0.456 và 0.432), việc loại bỏ thường là lựa chọn tốt nhất để đảm bảo tính phân biệt (discriminant validity).

Phương án 3 – Thay đổi rotation method: Chuyển từ Varimax sang Oblimin (cho phép nhân tố tương quan) hoặc Promax để xem có cải thiện không.

Cách xử lý khi KMO < 0.6 hoặc Bartlett không significant

Tình huống KMO thấp (< 0.6):

Nguyên nhân: Dữ liệu không có mối tương quan đủ mạnh giữa các biến, kích thước mẫu quá nhỏ, hoặc có quá nhiều biến không phù hợp.

Giải pháp thực tế:

Bước 1: Kiểm tra KMO cho từng biến riêng lẻ trong bảng Anti-image Correlations. Các biến có MSA (Measure of Sampling Adequacy) < 0.5 nên được loại bỏ.

Bước 2: Tăng kích thước mẫu nếu có thể. Trong một case study về thang đo sự hài lòng, việc tăng mẫu từ 120 lên 200 quan sát đã cải thiện KMO từ 0.573 lên 0.704.

Bước 3: Loại bỏ outliers. Sử dụng Mahalanobis Distance để phát hiện và loại bỏ các quan sát có khoảng cách quá lớn so với trung tâm dữ liệu.

Bước 4: Kiểm tra và xử lý missing data một cách thích hợp. Multiple Imputation thường cho kết quả tốt hơn listwise deletion.

Tình huống Bartlett’s Test không significant (p > 0.05):

Điều này nghĩa là ma trận tương quan không khác biệt đáng kể so với ma trận đơn vị – các biến không tương quan với nhau.

Giải pháp:

  • Kiểm tra lại tính đồng nhất của thang đo (tất cả biến có đo cùng một khái niệm không?)
  • Xem xét việc phân chia thành các nhóm biến nhỏ hơn cho phân tích riêng biệt
  • Cân nhắc sử dụng các phương pháp phân tích khác như Principal Component Analysis

Việc xử lý thành công các vấn đề trên không chỉ giúp có được kết quả EFA đáng tin cậy mà còn làm sâu sắc thêm hiểu biết về cấu trúc dữ liệu và thang đo đang sử dụng.

Đánh giá chất lượng và tính hợp lệ của mô hình EFA

Việc đánh giá chất lượng EFA không chỉ dừng lại ở việc có được kết quả mà cần đảm bảo mô hình đạt các tiêu chuẩn khoa học nghiêm ngặt.

Tiêu chí đánh giá mô hình EFA đạt chuẩn

Checklist đánh giá toàn diện cho mô hình EFA chất lượng cao:

Tiêu chí về phương sai giải thích:

  • Tổng phương sai tích lũy ≥ 60% (lý tưởng ≥ 65%)
  • Nhân tố đầu tiên không nên giải thích quá 50% tổng phương sai (tránh general factor)
  • Các nhân tố có eigenvalue > 1.0

Tiêu chí về Factor Loading:

  • Ít nhất 3 biến có loading ≥ 0.5 trên mỗi nhân tố
  • Không có biến isolated (chỉ một biến duy nhất trên nhân tố)
  • Cross-loading được kiểm soát tốt

Tiêu chí về Sample Adequacy:

  • KMO ≥ 0.7 (tốt), ≥ 0.8 (rất tốt)
  • Bartlett’s Test significant (p < 0.001 là lý tưởng)
  • Anti-image correlation diagonal values > 0.5 cho tất cả biến

Trong một nghiên cứu thực tế về thang đo chất lượng dịch vụ, mô hình EFA đạt chuẩn với: KMO = 0.834, tổng phương sai 67.2%, 4 nhân tố với eigenvalue từ 1.23 đến 5.67, và tất cả factor loadings > 0.6.

Kiểm tra lại độ tin cậy sau khi loại biến

Quy trình validation sau EFA:

Bước 1: Tính lại Cronbach’s Alpha cho từng nhân tố riêng biệt. Mỗi nhân tố nên đạt α ≥ 0.7, lý tưởng ≥ 0.8.

Bước 2: Kiểm tra Corrected Item-Total Correlation cho từng biến trong nhân tố. Giá trị nên ≥ 0.3, lý tưởng ≥ 0.5.

Bước 3: Đánh giá “Alpha if Item Deleted” – nếu loại bỏ một biến nào đó mà Alpha tăng đáng kể (> 0.05), cân nhắc loại bỏ biến đó.

Ví dụ thực tế: Nhân tố “Chất lượng phục vụ” ban đầu có 6 biến với α = 0.756. Sau khi phát hiện biến “Thời gian chờ đợi” có item-total correlation = 0.287 và “Alpha if deleted” = 0.789, biến này được loại bỏ. Kết quả: 5 biến còn lại với α = 0.823.

Validation techniques và Cross-validation

Split-half validation: Chia ngẫu nhiên mẫu thành hai phần bằng nhau, chạy EFA trên từng phần và so sánh kết quả. Cấu trúc nhân tố ổn định nên cho kết quả tương tự trên cả hai sub-samples.

Bootstrap validation: SPSS 2025 hỗ trợ bootstrap cho EFA. Phương pháp này tạo ra hàng nghìn samples bootstrap và kiểm tra độ ổn định của factor loadings. Confidence intervals cho factor loadings không nên chứa 0 để đảm bảo tính significant.

Cross-validation với mẫu mới: Nếu có điều kiện thu thập thêm dữ liệu, chạy Confirmatory Factor Analysis (CFA) trên mẫu mới để xác nhận cấu trúc nhân tố tìm được từ EFA. Đây là gold standard cho validation.

Kiểm tra construct validity:

  • Convergent validity: Các biến trong cùng nhân tố có mối tương quan cao
  • Discriminant validity: Correlation giữa các nhân tố không quá cao (< 0.85)
  • Face validity: Nhân tố có ý nghĩa hợp lý từ góc độ lý thuyết

MOSL đã áp dụng quy trình validation nghiêm ngặt này cho hơn 150 nghiên cứu, với tỷ lệ thành công 94% trong việc tạo ra các thang đo đáng tin cậy và hợp lệ từ EFA.

Hình minh họa

Trình bày và báo cáo kết quả EFA trong nghiên cứu

Việc báo cáo kết quả EFA cần tuân thủ các chuẩn mực khoa học để đảm bảo tính minh bạch và khả năng tái lập nghiên cứu.

Template báo cáo kết quả EFA theo chuẩn APA

Cấu trúc báo cáo chuẩn trong phần Methods:
“EFA được thực hiện bằng phần mềm SPSS 2025, sử dụng phương pháp Principal Axis Factoring với rotation Oblimin. Số nhân tố được xác định dựa trên eigenvalue > 1.0, scree plot, và ý nghĩa lý thuyết. Tiêu chí giữ lại biến là factor loading ≥ 0.5 và cross-loading < 0.3.”

Trong phần Results:
“Kiểm định Kaiser-Meyer-Olkin cho thấy dữ liệu phù hợp cho EFA (KMO = 0.834). Bartlett’s Test of Sphericity có ý nghĩa thống kê (χ² = 1247.56, df = 153, p < 0.001), xác nhận ma trận tương quan phù hợp cho phân tích nhân tố.

EFA rút trích được 4 nhân tố với eigenvalue > 1.0, giải thích 67.2% tổng phương sai. Sau khi loại bỏ 2 biến có factor loading < 0.5, mô hình cuối cùng gồm 18 biến phân bố trên 4 nhân tố…”

Cách trình bày bảng kết quả và biểu đồ

Bảng Factor Loadings chuẩn:

Biến quan sát Nhân tố 1 Nhân tố 2 Nhân tố 3 Communality
Nhân viên phục vụ nhiệt tình .856 .734
Thái độ lịch sự .794 .689
Eigenvalue 5.67 2.34 1.78
% Phương sai 31.5% 13.0% 9.9%
Cronbach’s α .875 .823 .756

Lưu ý về format bảng:

  • Sử dụng dấu gạch ngang (-) thay cho factor loadings < 0.3
  • Làm đậm các factor loadings chính (≥ 0.5)
  • Đính kèm thông tin eigenvalue, % variance và Cronbach’s Alpha

Viết phần Discussion cho kết quả EFA

Cấu trúc Discussion hiệu quả:

Đoạn 1 – Tổng quan kết quả: “EFA đã xác định thành công cấu trúc 4 nhân tố của thang đo chất lượng dịch vụ, phù hợp với lý thuyết SERVQUAL nhưng có sự điều chỉnh phản ánh đặc điểm thị trường Việt Nam.”

Đoạn 2 – Giải thích từng nhân tố: Mô tả ý nghĩa của từng nhân tố dựa trên nội dung các biến thành phần và so sánh với các nghiên cứu trước.

Đoạn 3 – Thảo luận về mô hình tổng thể: “Tổng phương sai giải thích 67.2% cho thấy mô hình có sức giải thích tốt. Tuy nhiên, nhân tố ‘Tin cậy’ giải thích tỷ lệ phương sai thấp hơn dự kiến (9.9%), có thể do đặc điểm văn hóa địa phương.”

Đoạn 4 – Hạn chế và hướng nghiên cứu tiếp theo: Đề cập đến cross-sectional design, kích thước mẫu, và gợi ý CFA để xác nhận cấu trúc.

Ví dụ thực hành: Phân tích EFA với dữ liệu mẫu

Để minh họa quy trình EFA hoàn chỉnh, chúng ta sử dụng dataset thực tế về thang đo chất lượng dịch vụ ngân hàng với 22 biến quan sát từ 256 khách hàng.

Dataset: Thang đo chất lượng dịch vụ ngân hàng (22 biến)

Mô tả dữ liệu:

  • N = 256 khách hàng ngân hàng tại TP.HCM
  • 22 biến đo lường chất lượng dịch vụ (thang Likert 5 điểm)
  • Các biến bao gồm: thái độ nhân viên, tiện ích công nghệ, môi trường vật lý, độ tin cậy

Kiểm tra ban đầu:

  • Missing data: 2.3% (acceptable với listwise deletion)
  • Outliers: 6 cases được loại bỏ dựa trên Mahalanobis Distance
  • Sample size final: 250 cases (ratio 11.4:1 với 22 biến)

Thực hiện đầy đủ quy trình EFA từ A-Z

Bước 1: Kiểm tra điều kiện tiên quyết

Cronbach's Alpha = 0.924 (Excellent)
KMO = 0.847 (Very good)
Bartlett's Test χ² = 2,847.6, df = 231, p < 0.001 (Significant)

Bước 2: Xác định số nhân tố

Eigenvalue rule: 5 factors > 1.0 (4.78, 3.21, 2.67, 1.89, 1.32)
Scree plot: Elbow appears at factor 4
Variance explained: 
- 5 factors: 72.4%
- 4 factors: 66.8% (chosen)

Quyết định giữ 4 nhân tố dựa trên scree plot và ý nghĩa lý thuyết.

Bước 3: Factor rotation và interpretation
Sử dụng Direct Oblimin rotation vì các nhân tố dịch vụ thường tương quan với nhau.

Bước 4: Làm sạch biến

  • Loại bỏ 3 biến có factor loading < 0.5
  • 1 biến cross-loading được reassign
  • Final model: 18 biến, 4 nhân tố

Giải thích kết quả và rút ra kết luận

Cấu trúc nhân tố cuối cùng:

Nhân tố 1 – “Service Excellence” (6 biến):

  • Eigenvalue = 4.78, giải thích 26.6% phương sai
  • Factor loadings từ 0.67 đến 0.89
  • Cronbach’s α = 0.887
  • Bao gồm: thái độ nhân viên, kỹ năng tư vấn, sự chuyên nghiệp

Nhân tố 2 – “Technology & Convenience” (5 biến):

  • Eigenvalue = 3.21, giải thích 17.8% phương sai
  • Factor loadings từ 0.62 đến 0.83
  • Cronbach’s α = 0.824
  • Bao gồm: ATM, internet banking, mobile banking

Nhân tố 3 – “Physical Environment” (4 biến):

  • Eigenvalue = 2.67, giải thích 14.8% phương sai
  • Factor loadings từ 0.71 đến 0.78
  • Cronbach’s α = 0.789
  • Bao gồm: thiết kế chi nhánh, tiện nghi, accessibility

Nhân tố 4 – “Trust & Security” (3 biến):

  • Eigenvalue = 1.43, giải thích 7.9% phương sai
  • Factor loadings từ 0.68 đến 0.75
  • Cronbach’s α = 0.743
  • Bao gồm: bảo mật thông tin, tin cậy giao dịch

Kết luận nghiên cứu:
EFA đã xác định thành công cấu trúc 4 chiều của chất lượng dịch vụ ngân hàng, phù hợp với xu hướng số hóa trong ngành banking. Mô hình giải thích 66.8% phương sai, đảm bảo tính robust cho các phân tích tiếp theo.

Đặc biệt, sự xuất hiện của nhân tố “Technology & Convenience” là độc đáo, phản ánh tầm quan trọng của fintech trong trải nghiệm khách hàng hiện đại. Cấu trúc này có thể được sử dụng để phát triển các mô hình hồi quy dự đoán sự hài lòng và lòng trung thành khách hàng.


Phân biệt EFA vs CFA vs PCA: Khi nào sử dụng phương pháp nào?

Tiêu chí EFA CFA PCA
Mục đích Khám phá cấu trúc tiềm ẩn Kiểm định mô hình có sẵn Giảm chiều dữ liệu
Lý thuyết nền Không cần Cần có sẵn Không cần
Khi sử dụng Phát triển thang đo mới Kiểm định thang đo có sẵn Giảm số biến, tránh multicollinearity

EFA phù hợp khi: Bạn nghiên cứu thang đo mới hoặc ứng dụng thang đo đã có vào văn hóa/ngữ cảnh mới. CFA phù hợp khi: Bạn có mô hình lý thuyết rõ ràng cần kiểm định. PCA phù hợp khi: Mục tiêu chính là giảm thiểu số biến cho phân tích tiếp theo.

Các phương pháp Rotation nâng cao trong EFA

Varimax: Rotation trực giao, tối thiểu hóa số biến có loading cao trên cùng nhân tố. Phù hợp khi giả định các nhân tố không tương quan.

Oblimin: Rotation chéo, cho phép nhân tố tương quan. Direct Oblimin với δ = 0 thường cho kết quả ổn định nhất. Phù hợp với hầu hết nghiên cứu thực tế.

Promax: Nhanh hơn Oblimin, phù hợp với dataset lớn. Quartimax và Equamax ít được sử dụng trong thực tế do hạn chế về interpretability.

Lựa chọn phương pháp: Bắt đầu với Oblimin. Nếu correlation giữa các nhân tố < 0.3, chuyển sang Varimax để có cấu trúc rõ ràng hơn.

Công cụ hỗ trợ phân tích EFA hiệu quả

SPSS Factor Analysis Extension: Cung cấp bootstrap confidence intervals, parallel analysis, và multiple rotation methods trong cùng một lần chạy.

R packages (psych, GPArotation): Flexible hơn SPSS với nhiều phương pháp rotation và visualization options. Package psych có function fa() rất mạnh mẽ cho EFA.

AMOS: Seamless transition từ EFA sang CFA trong cùng một phần mềm. Đặc biệt hữu ích cho two-step approach (EFA findings → CFA confirmation).

jamovi: Giao diện user-friendly, miễn phí, với khả năng export results sang APA format. Phù hợp cho nghiên cứu sinh mới học.

MOSL Analytics Platform: Giải pháp tích hợp từ data cleaning, EFA, CFA đến phân tích thống kê mô tả chuyên sâu. Hỗ trợ từ thiết kế nghiên cứu đến viết báo cáo hoàn chỉnh.


Để nhận được hỗ trợ chuyên sâu về phân tích dữ liệu EFA và các kỹ thuật thống kê nâng cao, Ib ngay cho MOSL để nhận thông tin tư vấn bằng cách liên hệ Hotline/Zalo: 0707339698. Đội ngũ chuyên gia của MOSL sẽ hướng dẫn bạn từ thiết kế nghiên cứu đến hoàn thiện bài báo khoa học.

Các câu hỏi thường được quan tâm bao gồm:
Cần bao nhiêu quan sát tối thiểu cho EFA? Quy tắc 5:1 hoặc 10:1 là chuẩn mực, tối thiểu 100 mẫu.
KMO bao nhiêu thì được coi là tốt? KMO ≥ 0.7 là tốt, ≥ 0.8 là rất tốt, < 0.6 không nên làm EFA.
Có cần kiểm tra phân phối chuẩn không? EFA tương đối robust nhưng phân phối quá lệch có thể ảnh hưởng kết quả.
Principal Component vs Principal Axis Factoring – chọn cái nào? PAF phù hợp hơn cho EFA vì tập trung vào common variance.
Làm thế nào khi có biến cross-loading? Loại bỏ nếu loading gần bằng nhau, reassign nếu có loading chính rõ ràng.
Factor loading bao nhiêu mới đủ để giữ lại? ≥ 0.5 là tốt, 0.3-0.5 cần cân nhắc dựa trên lý thuyết.
EFA có thể áp dụng cho biến phụ thuộc không? Không, EFA chỉ dành cho biến độc lập cùng đo một construct.
Sau EFA có cần làm CFA không? Nên làm CFA để xác nhận cấu trúc, đặc biệt khi có mẫu mới.

Tài liệu tham khảo từ các nguồn uy tín:
Hair, J. F., et al. (2019). Multivariate Data Analysis – Chương Factor Analysis.
Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics – Hướng dẫn chi tiết EFA.
Tabachnick & Fidell (2019). Using Multivariate Statistics – Phương pháp luận EFA nghiêm ngặt.
IBM SPSS Manual (2025) – Hướng dẫn kỹ thuật mới nhất.

Các thuật ngữ liên quan cần biết:
Factor Loading – Hệ số tải nhân tố, thể hiện mối quan hệ giữa biến quan sát và nhân tố.
Eigenvalue – Giá trị riêng, đo lường phương sai được giải thích bởi mỗi nhân tố.
Communality – Tỷ lệ phương sai của biến được giải thích bởi các nhân tố.
Cross-loading – Hiện tượng một biến có factor loading cao trên nhiều nhân tố.
Rotation – Phương pháp xoay nhân tố để có cấu trúc dễ giải thích hơn.
KMO – Kaiser-Meyer-Olkin measure, đánh giá độ phù hợp dữ liệu cho factor analysis.

Theo dõi fanpage MOSL để cập nhật thêm nhiều kiến thức hữu ích về phân tích dữ liệu và nghiên cứu khoa học.

Tấn Đăng

Chào bạn, tôi là Đăng hiện là 1 trong những Founder của Mosl.vn. Tôi hiện nay đã có hơn 5 năm kinh nghiệm trong quá trình thực hiện các nghiên cứu khoa học và xử lý đa dạng các phần mềm phân tích dữ liệu. Với kiến thức có được tôi hy vọng sẽ cung cấp đến bạn các thông tin bổ ích và giúp bạn hoàn thành bài nghiên cứu một cách tốt nhất. Tôi xin chúc các bạn học tập và làm việc hiệu quả!

89 bài viết Website

Để lại cảm nghĩ của bạn ở đây

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *