^Back To Top

foto1 foto2 foto3 foto4 foto5


Get Adobe Flash player

Mạng xã hội (Social Network) từ khi ra đời đã mang tới những lợi ích không nhỏ cho con người. Chúng ta có thể sử dụng mạng xã hội như một công cụ để giao tiếp, trao đổi và kết nối các thành viên trong mạng như hoạt động của xã hội bình thường. Để hiểu thêm về mạng xã hội chúng ta cần tìm hiểu một số khía cạnh như khái niệm mạng xã hội nói chung và mạng xã hội trực tuyến nói riêng; vấn đề phân tích và mô hình hóa mạng xã hội; bài toán xếp hạng trong phân tích mạng xã hội trực tuyến.

1. Tổng quan về mạng xã hội

Theo Wasserman và cộng sự [2], một mạng xã hội là một cấu trúc được tạo nên bởi một tập các tác nhân (như các cá nhân hoặc các tổ chức) và các liên kết đôi giữa các tác nhân. Quan điểm mạng xã hội cung cấp rõ ràng các cách thức phân tích cấu trúc của toàn bộ thực thể trong mạng.

Trong thực tế, một mạng xã hội có thể hình dung như mối quan hệ giữa các thành viên trong một gia đình, một lớp học hay trong cùng một công ty,…Thành viên trong những mạng này giao tiếp, trao đổi, chia sẻ…thông tin thông qua các mối quan hệ và tuân theo quy tắc giao tiếp xã hội. Rộng hơn nữa, một mạng xã hội có thể là tập hợp của các mạng xã hội nhỏ, trong đó các thành phần trong mạng xã hội nhỏ có liên kết với nhau và liên kết với các thành phần bên ngoài.

Hình 1. Mạng xã hội của các học sinh từ lớp 7 đến lớp 12

Trong biểu diễn mạng này, mỗi một học sinh là một nút (điểm) được đặc trưng bởi màu tương ứng với lớp. Mối liên kết giữa các học sinh được biểu diễn bằng các đường liên kết (lines/ties). Thông qua hình ảnh trong hình 1 chúng ta thấy cấu trúc của một mạng xã hội biểu diễn mối quan hệ giữa các sinh viên tại một vùng quê. Hiển nhiên, cấu trúc mạng xã hội bên dưới chỉ biểu diễn được có quan hệ giữa hai học sinh bất chứ không biểu diễn được các đặc trưng của các mối quan hệ (là bạn thân, người quen hoặc các đặc trưng khác).

Mạng xã hội trực tuyến (Online Social Network) là mạng xã hội hoạt động dựa trên môi trường mạng/Internet. Do đó, mạng xã hội trực tuyến mang đầy đủ những đặc tính, tính chất của mạng xã hội thông thường và được bổ sung thêm các đặc tính liên quan tới mạng Internet. Một số mạng xã hội trực tuyến có thể kể đến như: Facebook, MySpace, Twitter, Youtube, Orkut, … Tại Việt Nam cũng có một số mạng xã hội trực tuyến như Zing Me, YuMe hay Tamtay…

Hình 2. Mô hình của một mạng xã hội trực tuyến

Phân tích mạng xã hội (Social Network Analysis – SNA) là phương thức phân tích các mạng xã hội (social networks). Phân tích mạng xã hội xem các liên kết xã hội (social relationships) trong khái khái niệm của lý thuyết xã hội (network theory), bao gồm các nút (nodes) biểu diễn các tác nhân bên trong mạng (có thể là con người, các tổ chức,…) và các liên kết (ties) biểu diễn mối quan hệ giữa các tác nhân, như liên kết bạn bè (friendship), mối quan hệ họ hàng (kinship), vị trí các tổ chức (organization possition), các liên kết giới tính,…[1]. Các mạng này thường được miêu tả trong một biểu đồ mạng xã hội (social network diagram), nơi mà các nút được biểu diễn như các điểm và các liên kết được biểu diễn bởi các đường nối các điểm. Do đó, mô hình mạng xã hội có mối quan hệ chặt chẽ với lý thuyết đồ thị. Khi xem xét một mạng xã hội thì nó tương đương với một đồ thị (có hướng/ vô hướng) G = <V, E>, trong đó:

V: là tập các đỉnh, tương ứng với các nút tham gia mạng

E: tập các cạnh (cung) liên kết các đỉnh           

Hai đỉnh u, v được gọi là có liên kết (láng giềng) nếu có đường đi trực tiếp từ đỉnh u tới đỉnh v.

2. Bài toán xếp hạng (Ranking Problem) trong phân tích mạng xã hội trực tuyến

Bài toán xếp hạng là một trong những bài toán quan trọng trong phân tích đồ web cũng như trong đồ thị mạng. Việc tìm ra các nút có hạng cao trong mạng là một yêu cầu cần thiết, thông qua sự ảnh hưởng của các nút này tới các nút khác chúng ta có thể dự đoán sự thay đổi của cấu trúc mạng. Ý tưởng của bài toán xếp hạng được xuất phát từ các nghiên cứu của hai nghiên cứu sinh là Sergey Brin, Lawrence Page và các cộng sự được công bố vào tháng 8 năm 1998. Phương pháp này dựa trên ý tưởng: “Nếu có liên kết từ trang A đến trang B thì độ quan trọng của A cũng ảnh hưởng tới độ quan trọng của B”. Thuận toán PageRank ban đầu được áp dụng cho việc xếp hạng các nút trên đồ thị web, và về sau này có một số thuật toán cải tiến như Modified Adaptive PageRank và Topic-sensitive PageRank. Về sau này, thuật toán PageRank và các cải tiến của nó cũng được dùng vào việc xếp hạng các nút trong mạng xã hội.

Thuật toán PageRank

Các trang web được đánh số từ 1, 2, …, m. Gọi N(i) là số trang Web có liên kết từ trang i và B(i) là số trang Web có liên kết đến trang i. Khi đó, giá trị PageRank r(i) ứng với trang i được tính như sau:

         

Đặt r = [r(1), r(2),..., r(n)] là vector PageRank, trong đó thành phần thứ i là hạng tương ứng của trang Web thứ i. Như vậy công thức trên được viết lại như sau:

   r = (vector PageRank r là vector riêng của ma trận và A là ma trận kích thước n*n với các giá trị phần tử được tính như sau:

  aij  = nếu có liên kết từ i tới j, bằng 0 trong trường hợp ngược lại

Thuật toán PageRank được mô tả như sau (sử dụng phương pháp lặp)

               1. s ← vector bất kỳ

               2. r ←

               3. Nếu ||r – s|| < thì kết thúc ( là số dương bé, được gọi là sai số lặp), nhận được r là vector PageRank; nếu không thì s ← r và quay lại bước 2.

   Trong một số trường hợp, trang Web không có liên kết hoặc không được liên kết từ các trang khác thì r của trang đó luôn bằng 0. Để hạn chế trường hợp này người ta đưa thêm hệ số hãm d, và công thức tính PageRank được viết lại như sau:

            

Bằng thực nghiệm, hệ số d nằm trong khoảng [0,8 ; 0,85]

3. Kết luận

Qua đây, chúng ta đã phần nào hiểu tổng quan về mạng xã hội, mạng xã hội trực tuyến, phân tích mạng xã hội, đặc biệt là bài toán điển hình xếp hạng trong phân tích mạng xã hội. Trong lĩnh vực phân tích mạng xã hội còn có một số bài toán cơ bản khác như: Thu thập dữ liệu (Data Crawling), bài toán phát hiện vai trò (Roles Detection Problem), bài toán dự đoán liên kết mạnh – yếu (Strong – Weak/ Possitive – Negative ties Detection Problem).

TÀI LIỆU THAM KHẢO

[1]. Pinheiro, Carlos A.R. (2011). Social Network Analysis in Telecommunications. John Wiley & Sons. p. 4.

[2]. Wasserman, Stanley, Faust, Katherine (1994). "Social Network Analysis in the Social and Behavioral Sciences". Social Network Analysis: Methods and Applications. Cambridge University Press. pp. 1–27.

[3]. H. Q. Thuy, P. X. Hieu, D. Son, N. T. Thanh, N. T. Trang, and N. C. Tu. Giáo trình khai phá dữ liệu Web. NXB Giáo dục Việt Nam, 2009.