Hệ số tương quan Pearson | Top #1 Cách phân tích trong Stata

hệ số tương quan
5/5 - (2 bình chọn)

Hệ số tương quan trong tiếng Anh gọi là Correlation coefficient là một chỉ số đo lường mức độ tương quan giữa hai biến số với nhau, giúp phát hiện được mối liên kết thống kê giữa chúng. Các biến số có thể là từ hai cột biến số trong bộ dữ liệu quan sát hoặc hai phần của một biến ngẫu nhiên đa biến số với phân phối đã biết trước đó.

Một số loại hệ số tương quan tồn tại, mỗi loại có định nghĩa riêng và phạm vi sử dụng và đặc điểm riêng. Tất cả chúng đều giả định các giá trị trong phạm vi từ −1 đến +1, trong đó ± 1 biểu thị thỏa thuận mạnh nhất có thể có và 0 là bất đồng mạnh nhất có thể có.

Là công cụ phân tích, các hệ số tương quan thể hiện một số vấn đề nhất định, bao gồm xu hướng của một số loại bị bóp méo bởi các ngoại lệ và khả năng được sử dụng không chính xác để suy ra mối quan hệ nhân quả giữa các biến (để biết thêm, xem Tương quan không ngụ ý nhân quả tại Wiki nhé! ).

1. Hệ số tương quan là gì? 

1.1. Khái niệm

Hệ số tương quan
Hệ số tương quan
Hệ số tương quan trong tiếng Anh gọi là Correlation coefficient là một chỉ số đo lường mức độ tương quan giữa hai biến số với nhau, giúp phát hiện được mối liên kết thống kê giữa chúng. Các biến số có thể là từ hai cột biến số trong bộ dữ liệu quan sát hoặc hai phần của một biến ngẫu nhiên đa biến số với phân phối đã biết trước đó. MOSL
Hệ số tương quan là một thước đo bằng số của một số loại tương quan, có nghĩa là mối quan hệ thống kê giữa hai biến số. Các biến có thể là hai cột của một tập dữ liệu quan sát đã cho, thường được gọi là mẫu, hoặc hai thành phần của một biến ngẫu nhiên đa biến có phân phối đã biết. Wikipedia

Xem thêm: Hệ số xác định r2 bình phương hiệu chỉnh là gì?

1.2. Ý nghĩa Hệ số tương quan

Hệ số tương quan cũng như các chỉ số khác khi sinh ra và lớn lên đều có ý nghĩa trong cuộc đời này :))) như:

  • Hệ số tương quan là chỉ số thống kê đo lường mức độ mạnh yếu trong mối quan hệ giữa hai biến số. Có nhiều loại HSTQ khác nhau (tương quan kendall, kappa,…) và mỗi loại được định nghĩa với phạm vi sử dụng cùng đặc tính riêng biệt.
  • Là công cụ phân tích với một số vấn đề nhất định gồm khuynh hướng của một số loại yếu tố nhiễu bởi yếu tố ngoại lai và khả năng được sử dụng tương đối nhằm suy ra mối quan hệ nhân quả giữa các biến số.
  • Hệ số tương quan có thể được hồi quy trong các phần mềm như Stata, Spss, Eview, R,…

Xem thêm: Cách chạy hồi quy trong spss

Một số loại tương quan gồm:

  • Tương quan nội kính (ICC – Intraclass correlation) là thống kê mô tả cho phép đo định lượng các hệ số.
  • Tương quan thứ hạng là thước đo mối quan hệ giữa thứ hạng của hai biến.
  • HSTQ thứ hạng Kendall tau là thước đo phần xếp hạng phù hợp giữa hai tập dữ liệu.
  • Gamma Goodman,Kruskal là thước đo độ liên kết của 2 biến dữ liệu chéo khi đo ở cấp thứ tự.
  • Hệ số tương quan đa sắc đo lường sự kết hợp giữa hai biến phân loại có thứ tự.

1.3. Cách tính hệ số tương quan

Như đã nhắc ở mục 1.2 rằng Hệ số tương quan có khá nhiều loại tuy nhiên phổ biến nhất trong thống kê vẫn là loại hệ số tương quan Pearson. Hệ số này đo lường sức mạnh trong mối quan hệ giữa hai biến tuyến tính với nhau và không đo lường được khi 2 biến có quan hệ phi tuyến tính, bên cạnh đó cũng không phân biệt giữa các biến độc lập (biến quan sát or giải thích) với biến phụ thuộc.

Công thức tính Hệ số tương quan như sau:

Correlation là gì
Công thức tính hệ số tương quan

Trong đó:

ρxy : Hệ số tương quan Pearson
Cov(x,y) : Hiệp phương sai (covariance) của biến x và y
σx ; σy : Độ lệch chuẩn của x và y

Tham khảo bài viết: Hồi quy tuyến tính để học hỏi cách tính hiệp phương sai và độ lệch chuẩn.

Xem thêm: Hiệp phương sai (covariance) là gì? | Độ lệch chuẩn là gì?

2. Hệ số tương quan pearson là gì?

Hệ số tương quan có một người anh em cũng cha khác mẹ là hệ số tương quan Pearson:

  • Hệ số tương quan Pearson (Tiếng Anh là Pearson product-moment Correlation Coefficient, được ký hiệu là r hay R, or Pearson’s r), cũng tương tự như hệ số tương quan chung thì tương quan Pearson cũng là hệ số dùng để đo lường mối quan hệ thống kê tương quan giữa hai biến số với nhau.

Ví dụ về mối quan hệ giữa 2 biến số x và y là thu nhập và thời gian làm việc; hay mối quan hệ giữa giá vàng với giá dầu trên thế giới, giữa 2 cổ phiếu, 2 mã chứng khoán … có rất nhiều mối quan hệ mà bạn cần phải kiểm định và cần dùng tới hệ số này để tìm ra kết quả.

  • Phương pháp sử dụng hệ số tương quan pearson được biết đến như là một phương pháp tốt nhất để đo lường mối quan hệ giữa các biến mà bạn quan tầm vì nó dựa trên công thức từ hiệp phương sai của biến. Hệ số tương quan pearson thể hiện cho ta biết về tầm quan trọng của mối liên hệ, tương quan và chiều hướng tác động nhân quả của biến.

Funfact: Đặc biệt, hệ số tương quan pearson còn giúp các bạn nhận biết sớm được hiện tượng đa cộng tuyến bằng dấu hiệu TQ của các biến độc lập với nhau.

Xem thêm: Hệ số tương quan spearman là gì?

3. Các tiêu chí trong hệ số tương quan Pearson

Hệ số tương quan Pearson (r) dao dộng giá trị từ -1 đến 1

(Để chính xác bạn cần tính ra p-value (sig) của r để xác định mqh)

Xem thêm: Cách tính p-value bằng tay

Khi r âm hoặc r dương Hệ số tương quan r có giá trị âm hoặc dương thì ta nói hai biến đấy có mối quan hệ nghịch biến (tương quan âm) hoặc mối quan hệ đồng biến (tương quan dương).
Khi r = 0 Tức không có mối quan hệ nào giữa 2 biến hoặc 2 biến có mối quan hệ phi tuyến với nhau
Khi r = 1 Tức thể hiện việc tương quan dương tuyệt đối giữa 2 biến.
Khi r = -1 Tức thể hiện việc tương quan âm tuyệt đối giữa hai biến
Khi r -> 0 Tức r gần tiến về 0 thì tương quan tuyến tính giữa 2 biến càng yếu

CỰC CHÚ Ý: Việc theo dõi từ Hệ số tương quan Pearson (r) chỉ cho bạn phỏng đoán trước giữa hai biến có mối quan hệ với nhau hay không và mối quan hệ đó là âm hay dương. Ngoài ra, để xác định chính xác chúng có mối tương quan với nhau hay không thì bạn cần phải tính ra p-value (sig) nếu nhỏ hơn mức ý nghĩa (significance level) 5% thì có tương quan và ngược lại thì không có tương quan giữa 2 biến so sánh.

Bonus thần chú: Giá trị r cao cận +1,00 thể hiện mối quan hệ trực tiếp mạnh mẽ, các giá trị r gần 0,50 được coi là vừa phải và các giá trị dưới r 0,30 được coi là cho thấy mối quan hệ yếu.

4. Phân tích hệ số tương quan pearson trong phần mềm Excel và Stata

4.1. Excel

Hàm CORREL trả về HSTQ của hai phạm vi ô. Dùng HSTQ để xác định mối quan hệ giữa hai thuộc tính.

Ví dụ, có thể kiểm tra mối quan hệ hay liên kết giữa 2 sự vật, sự việc nào đó.

Cú pháp:

CORREL(array1, array2)

Trong đó:

  • array1: dữ liệu nhập vào bắt buộc một phạm vi giá trị ô.
  • array2: dữ liệu nhập vào bắt buộc phạm vi thứ hai chứa các giá trị ô.

Ví dụ về HSTQ của hai tập dữ liệu trong các cột A và B.

công thức tính hệ số tương quan
Công thức tính hệ số tương quan

Ngoài ra bạn có thể tính HSTQ đơn giản bằng máy tính nữa nhé!

4.2. Stata

Trước khi thực hiện tải về bộ dữ liệu để thực hành lun nhé!

Từ Menu các bạn chọn theo như sau: Statistics -> Summaries, tables, and tests -> Summary and descriptive statistics -> Pairwise correlations

Hệ số tương quan trong Stata
Hệ số tương quan trong Stata

Sau đó sẽ hiện ra bảng dưới:

Hệ số tương quan trong Stata
Hệ số tương quan trong Stata

Đưa vào ô Variales biến phụ thuộc và các biến độc lập, sau đó tích vào ô Don’t adjust significance và nhấn OK, kết quả phân tích tương quan như sau:

Xem thêm: Phân tích tương quan bằng sig. trong spss

Hệ số tương quan trong Stata
Hình 3.1. Ma trận hệ số tương quan pearson trong Stata

Thực hiện tương tự bằng lệnh sau: pwcorr roa size cpi rgdp state, sig để hiện ra sig cho HSTQ.

Nếu không muốn có sig bạn đơn giản chỉ cần thực hiện theo lệnh: corr roa size cpi rgdp state

Xem thêm: Cách kiểm định hàm tự tương quan (autocorrelation) trong Stata

4.3. Đọc ý nghĩa hệ số tương quan pearson trong STATA

Từ Hình 3.1 Ma trận tương quan pearson phía trên có thể thấy phân tích như sau:

  • Hình vuông đen ở trên trong đó chỉ số bên trên là 0.4074 chính là HSTQ của biến cpibiến roa tức biến độc lập với biến phụ thuộc roa. Chỉ số ở dưới là 0.0000 thể hiện giá trị sig = 0.0000 < 0.05 (mức ý nghĩa – significance level 5%) nên ta kết luận giữa 2 biến cpiroa có mối tương quan với nhau và là tương quan dương.
  • Tương tự, hình vuông đen ở dưới trong đó chỉ số bên trên là 0.1735 là hệ số tương quan thể hiển biến độc lập rgdp có tương quan dương với biến độc lập size, giá trị sig = 0.0233 < 0.05 nên ta kết luận giữa 2 biến rgdpsize có mối tương quan với nhau.

Khi 2 biến độc lập có mối quan hệ với nhau điều này sẽ làm xuất hiện hiện tượng đa cộng tuyến trong mô hình và điều này là điều mà bạn không muốn nó xảy ra.

Lưu ý: Nếu các bạn muốn chỉ dựa vào HSTQ để đánh giá mối quan hệ thì nên dùng mốc r = 0.2 (hoặc -0.2) để xem xét (Ví dụ: khi r>0.2 or -0.2 thì có tương quan còn ngược lại càng tiến về 0 thì không có tương quan giữa 2 biến. Tuy nhiên cách này chỉ để giúp bạn đưa ra phỏng đoán nhanh và chỉ mang tính chính xác tương đối.

5. Ứng dụng của hệ số tương quan trong tài chính

Người ta thường xem xét tới độ mạnh yếu của mối quan hệ tương quan như sau:

  • Dù giá trị 0,2 cho kết quả tương quan đồng biến giữa 2 biến nhưng mối tương quan này yếu và thật sự không đáng kể
  • Tương quan mạnh thì r phải đạt ý nghĩa ít nhất với giá trị r là 0,8 trở lên.

Một số ứng dụng hệ số tương quan trong tài chính:

  • HSTQ xác định mối tương quan giữa giá cổ phiếu của một công ty sản xuất dầu với giá dầu thô vì đa phần các công ty dầu mỏ nhờ vào giá dầu tăng lên thì họ mới kiếm được lợi nhuận làm giá cổ phiểu tăng và mối quan hệ này là tương quan dương.
  • Các chỉ số tài chính như tỷ lệ đòn bẩy và lợi nhuận khi chúng có mối tương quan cùng chiều với nhau thì doanh nghiệp có thể tận dụng để phát triển kinh doanh vì khi doanh nghiệp sử dụng nhiều đòn bẩy mà làm cho lợi nhuận tăng thì họ nên cân nhắc gia tăng thêm việc vay vốn chẳng hạn để đầu tư kinh doanh.
  • Khi làm thống kê về mối tương quan nhà đầu tư có thể xác định khi nào mối tương quan giữa hai biến thay đổi để chủ động thực hiện theo kế hoạch của mình. Ví dụ: Lãi suất cho vay tính theo lãi suất thị trường và cổ phiếu của ngân hàng thường có mối quan hệ tích cực với nhau khi lãi suất cho vay tăng lên, thế nên nhà đầu tư có thể tận dụng điều này.

Nói sâu hơn về ví dụ 2 trong các ứng dụng tài chính: Khi nhà đầu tư cảm thấy giá cổ phiếu ngân hàng đang giảm trong khi lãi suất vay vẫn tăng thì có thể đặt ra nghi vấn về ngân hàng mình đang đầu tư liệu họ đang hoạt động không hiệu quả hay không. Điều này có thể chứng minh thong qua việc xem xét giá cổ phiếu của các ngân hàng tương tự cùng trong ngành để đưa ra kết luận có nên đầu tư tiếp hay không ở ngân hàng đấy.

6. Video hướng dẫn chạy ma trận tương quan chuyên sâu trong STATA

Hệ số tương quan pearson và cách chạy trong phần mềm STATA

7. Tổng kết

Nhìn chung MOSL đã cung cấp đến các bạn các phần sau:

  • Hệ số tương quan là gì? – Khái niệm, Ý nghĩa và cách tính
  • Các loại Hệ số tương quan
  • Giải thích Hệ số tương quan pearson là gì?
  • Các tiêu chí trong Hệ số tương quan pearson
  • Phân tích và đọc kết quả tương quan trong Stata và Excel
  • Ứng dụng của Hệ số tương quan

Đến đây, MOSL xin chúc các bạn tự do học tập và làm việc hiệu quả!

Xem thêm: Dịch vụ xử lý số liệu và hỗ trợ chạy Stata của Mosl.vn

Tag: phan tich tuong quan spss | đối tượng biểu mẫu trong hệ quản trị cơ sở dữ liệu access có thể dùng để làm gì | he so tuong quan pearson la gi | danh mục đầu tư | hstq trong kinh tế lượng | hstq bội | cach tinh he so tuong quan | hstq hạng spearman | yý nghĩa của hstq | hstq biến tổng lớn hơn 0.3 | cong thuc tinh he so tuong quan | bao nhiêu là đa cộng tuyến | tỷ suất sinh lời | ước lượng | số quan hệ tương đương | xác suất thống kê | cơ sở dữ liệu quan hệ đối tượng | thứ bậc | từng phần | bài tập có lời giải | không gian | excel 2007 | Sự suy giảm tq

Facebook
LinkedIn
Twitter
Tumblr
Pinterest

BÀI VIẾT XEM NHIỀU CÙNG CHỦ ĐỀ

Tấn Đăng

Tấn Đăng

Chào bạn, tôi là Đăng hiện là 1 trong những Founder của Mosl.vn. Tôi hiện nay đã có hơn 5 năm kinh nghiệm trong quá trình thực hiện các nghiên cứu khoa học và xử lý đa dạng các phần mềm phân tích dữ liệu. Với kiến thức có được tôi hy vọng sẽ cung cấp đến bạn các thông tin bổ ích và giúp bạn hoàn thành bài nghiên cứu một cách tốt nhất. Tôi xin chúc các bạn học tập và làm việc hiệu quả!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *