初步发现
比较SC-LIWC对于不同书写内容之区辨力与预测能力。
1. LIWC作为一种语言分析工具,除了抓取率之外,更重要的是能否预测个体的心理特性。
过去研究指出,相较于书写中性主题,个体在书写情绪主题时使用较多的第一人称单数代名词(Sharp & Hargrove, 2004),显示文本内容在涉及不同主题时,会呈现不同的使用特性。Boals(2005)的研究更进一步以分手经验为题,发现个体在描述分手后的情境时,使用较多的第一人称单数代名词和负向情绪词。黄金兰等人(2012)以TCLIWC分析忧郁书写文本与打工书写文本,也发现忧郁组呈现较多的第一人称单数代名词和负向情绪词,打工组呈现较多的工作词、成就词及金钱词。倘若SCLIWC对简体文本内容的分析结果,也能复制过去研究结果,呈现类似的语言使用特性,即验证了SCLIWC能够有效地呈现个体的心理特性。
本研究以书写失恋经验的文本做为实验组,另选择书写打工经验为主的文本做为对照组,前者着重于负向事件的经验描述,后者则是概括不同的心情与经验内容。研究者预测失恋经验文本应呈现较高比率的第一人称单数代名词与负向情绪词,另一方面,打工经验因其书写内容为特定主题,故预测相较于实验组,应用较高比率的工作词、成就词及金钱词。研究結果支持上述預測。
2. Newman、Groom、Handelman和Pennebaker (2008)汇整了来自不同研究室的70个不同研究的资料,总共获得超过14000文本档案,并以LIWC进行性别差异探讨。
研究结果发现,整体而言,女性的语言特性偏向心理与社交历程,男性的语言特性则偏向事物特性与非人际主题,此结果也正是过去众多性别差异研究成果中最常出现的特性。例如Schler、Koppel、Argamon和Pennebaker(2005)使用大量的blog文本分析,也得到类似的结果,即女性语言偏向社交投入,男性语言偏向讯息提供。
本研究将依据上述的性别差异整体预测型态,推论在以LIWC2007为本所建立的SC-LIWC上,应可观察到某些变项差异。具体而言,本研究预测在LIWC的输出变项中,应可以观察到女性博主在与沟通表达相关的代名词(尤其是人称代名词与第一人称单数代名词)、副词、常用动词、助动词、社会词(包括朋友词,家庭词)、情感词(包括正向词与负向词)等,使用率要比男性博主来得多;相对的,男性博主则在讯息提供相关的变项使用率较女性博主高,包括与名词相关的数字词、数量值、特指定词等,与精准复杂句子有关的介系词,限制词等,以及与人事时地物描述相关的相对词、移动词、空间词、时间词、工作词、成就词、休闲词、金钱词等。結果也大致符合上述預測。
1. LIWC作为一种语言分析工具,除了抓取率之外,更重要的是能否预测个体的心理特性。
过去研究指出,相较于书写中性主题,个体在书写情绪主题时使用较多的第一人称单数代名词(Sharp & Hargrove, 2004),显示文本内容在涉及不同主题时,会呈现不同的使用特性。Boals(2005)的研究更进一步以分手经验为题,发现个体在描述分手后的情境时,使用较多的第一人称单数代名词和负向情绪词。黄金兰等人(2012)以TCLIWC分析忧郁书写文本与打工书写文本,也发现忧郁组呈现较多的第一人称单数代名词和负向情绪词,打工组呈现较多的工作词、成就词及金钱词。倘若SCLIWC对简体文本内容的分析结果,也能复制过去研究结果,呈现类似的语言使用特性,即验证了SCLIWC能够有效地呈现个体的心理特性。
本研究以书写失恋经验的文本做为实验组,另选择书写打工经验为主的文本做为对照组,前者着重于负向事件的经验描述,后者则是概括不同的心情与经验内容。研究者预测失恋经验文本应呈现较高比率的第一人称单数代名词与负向情绪词,另一方面,打工经验因其书写内容为特定主题,故预测相较于实验组,应用较高比率的工作词、成就词及金钱词。研究結果支持上述預測。
2. Newman、Groom、Handelman和Pennebaker (2008)汇整了来自不同研究室的70个不同研究的资料,总共获得超过14000文本档案,并以LIWC进行性别差异探讨。
研究结果发现,整体而言,女性的语言特性偏向心理与社交历程,男性的语言特性则偏向事物特性与非人际主题,此结果也正是过去众多性别差异研究成果中最常出现的特性。例如Schler、Koppel、Argamon和Pennebaker(2005)使用大量的blog文本分析,也得到类似的结果,即女性语言偏向社交投入,男性语言偏向讯息提供。
本研究将依据上述的性别差异整体预测型态,推论在以LIWC2007为本所建立的SC-LIWC上,应可观察到某些变项差异。具体而言,本研究预测在LIWC的输出变项中,应可以观察到女性博主在与沟通表达相关的代名词(尤其是人称代名词与第一人称单数代名词)、副词、常用动词、助动词、社会词(包括朋友词,家庭词)、情感词(包括正向词与负向词)等,使用率要比男性博主来得多;相对的,男性博主则在讯息提供相关的变项使用率较女性博主高,包括与名词相关的数字词、数量值、特指定词等,与精准复杂句子有关的介系词,限制词等,以及与人事时地物描述相关的相对词、移动词、空间词、时间词、工作词、成就词、休闲词、金钱词等。結果也大致符合上述預測。