- +1
面对Twitter上的网络欺凌,人们究竟在关注什么?
欺凌是一个被广泛讨论的话题,被定义为反复和故意伤害他人的行为。网络欺凌的提法在国内不太常见,但如果数舆君用网络暴力来解释,想必大家都不会陌生。充斥于社交网络中的辱骂、恶意让人们对网络暴力嗤之以鼻,尤其是近年来影视名人遭受网络暴力而产生抑郁、自杀的新闻日益增加,社会对这一现象投入了更多的关注。而网络欺凌现象则多发于青少年群体当中,成为影响青少年身心健康的一大公害。今天数舆君就来分享一篇最近的关于社交网站的网络欺凌的论文。
研究者通过梳理文献发现,少有研究使用社交网站来了解人们对网络欺凌的见解。因此,本研究试图使用Twitter作为数据源,来了解人们对网络欺凌的看法和信息共享行为。
数舆君查阅益普索“2018年网络欺凌报告”,数据显示,全球对网络欺凌的认识正在提高,但仍有1/4的成年人没有听说过。全球1/3的父母报告说他们知道社区中有孩子是网络欺凌的受害者。但是,在处理网络欺凌方面,多数人认为现有的反欺凌措施是不够的。
图1:益普索2018网络欺凌报告(图片来源:益普索报告)
这篇论文主要讨论以下三个问题:
Q1: 网络欺凌推文中讨论的最常见主题是什么?
Q2: 人们对网络欺凌行为的情绪反应是什么?
Q3: 什么样的信息资源最常用于分享有关网络欺凌的信息?
研究方法:
本研究利用文本挖掘方法分析数据,包括推文的频率,双字母组合,情感分析,主题建模以及关键词的共现网络分析。
数据采集:
研究者利用Twitter的应用程序编程接口(API)收集包含“#cyberbullying”和“cyberbullying”的实时英文推文,并使用RStudio软件中的search_Tweets函数,将推文总数设置为100万,采集了2019年3月28日至2019年4月6日的推文。由于Twitter只允许访问这些已发布在过去7天内的推文,最终只检索了9856条推文作为分析样本。
分析过程:
1、词频分析
(图片来源:论文原文)
在统计高频词汇的基础上,本文选取了最常见的双字母组(如图2所示)。主要包括社交媒体(94),停止网络欺凌(81),网络欺凌(45),网络欺凌密歇根(41),教师必不可少(37)等词汇。
小贴士:
密歇根网络欺凌法:美国密歇根州州长里克斯奈德(Rick Snyder)在去年曾签署了一项法案,将网络欺凌正式定义为轻罪,可处以93天监禁和500美元罚款。“反复骚扰”为重罪,最高可判处5年监禁和5000美元罚款。此外,如果网络欺凌导致受害者死亡,最高可判处10年监禁和1万美元罚款。此法案已经于今年三月正式生效。
另外,研究者还分析了网络欺凌推文中的情绪,以深入了解人们对网络欺凌的看法。数据表明,网民对网络欺凌的态度主要表现为正面和负面两种情绪。与负面情绪有关的最常见词条是欺凌,骚扰,仇恨和自杀。积极情绪中最常见的词条是支持,爱,免费,线索和安全。图9显示,积极情绪的频率高于负面情绪。
(图片来源:论文原文)
2、主题建模
(图片来源:论文原文)
研究者进一步使用主题建模来识别推文中的模式和主题,并制作了四大主题模型。主题模型1包括一些重要的术语,如行为、人、儿童、参与。主题模型2包括人、孩子、父母、在线和网络。主题模型3包括人、儿童、互联网和在线。主题模型4包括密歇根,女孩,在线,停止,照片,媒体和互联网等术语。
3、关联网络分析
(图片来源:论文原文)
为了进一步了解网络欺凌推文中哪些关键字对比其他术语更频繁地发生,研究者创建了关键词的关联网络分析。 根据图11,研究者找到了照片和共享(r = 0.9),社交和媒体(r = 0.8),女孩和照片(r = 0.8),教师和指南(r = 0.7)等七个关键字簇。
研究者发现,女孩、照片和共享之间的相关性强达0.9,这表明与外表相关的网络欺凌存在性别差异:女孩比男孩更容易被网络欺凌。之前就曾有研究发现,因为女孩倾向于在社交媒体上发布照片或自拍,所以在遭受网络欺凌时,女孩们的外表成为主要的攻击对象。
4、分析URL的性质
小贴士
URL:统一资源定位符(Uniform Resource Locator,URL)是指一种可以从互联网上得到的资源的位置和访问方法的表示方式,互联网上的每个文件都有一个唯一的URL。(来源:360百科)
通过分析URL的性质,研究者进一步研究了Twitter用户的信息共享行为。总体而言,在2465条分析的推文中共享了1464个唯一网址,也就是说,59.39%的推文包含一个URL(一些推文可能包含多个URL)。 如下表所示,在线文章和网站是Twitter上分享的顶级资源之一。另外,其他平台,如博客、Twitter(链接到Twitter帖子的URL)和YouTube视频也被看作是最共享的资源。
(图片来源:论文原文)
通过分析,研究人员的三大问题得到了解答
Q1:网络欺凌推文中讨论的最常见的主题是什么?
A1:人们多在推文中使用带有“网络欺凌”和“#网诺欺凌”的一般术语和主题标签,其中最常见的主题是父母,孩子和女孩。人们更加关心的是如何预防和保护儿童,并且提到家长和老师在教育和防止网络欺凌方面发挥着重要作用。
Q2:人们对网络欺凌行为的情绪反应是什么?
A1:通过词频分析,研究者发现含有积极情绪的推文高于含有消极情绪的推文,人们普遍对受网络欺凌者持同情、理解态度。
Q3:什么样的信息资源最常用于分享有关网络欺凌的信息?
在线文章和网站是Twitter上分享的顶级资源之一。 此外,其他平台,如Twitter(或者链接到Twitter帖子的URL)、博客和YouTube视频也被看作是最共享的资源。
结论:
在Twitter上,与网络欺凌相关的推文表明人们重点关注父母和教师在应对网络欺凌上的作用,人们普遍认为,家庭和学校教育应该成为减弱网络欺凌对青少年伤害的重要保障。另外,大量推文还强调了引起人们注意的某些事件,比如密歇根网络欺凌法的实施,这表明人们对相关的法律保障抱有期待。最后,研究者建议教师和家长注意教育儿童和青少年关于在社交媒体上分享视觉内容(如照片,视频)的后果。未来的研究应该考虑调查推文中的视觉内容以及网络欺凌同性别差异之间的关系。
数舆君想说:
此篇论文最突出的特点在于运用了文本分析方法,从词频分析到字母组合,再从主题建模到共现网络分析,层层递进。并且选择了社交巨头Twitter作为数据来源,保证了研究样本的代表性,值得借鉴。文章也为今后的网络欺凌话题的研究提供了明晰的方向,即调查视觉内容本身的性质和受害者的性别差异,在这一基础上进行深入研究,想必会得出更加丰富的结论。然而,这项研究也存在一定的限制,那便是收集和分析的推文数量较少,分析结果的信度可能存在误差。
论文原文:
Iman Tahamtan,Li-Min Huang. #Cyberbullying in the Digital Age: Exploring People's Opinions with Text Mining[J], Computer Science,2019.
撰文:董杏杏
排版:刘丹甜
校对:张华琳
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司