使用SC-LIWC词典注意事项
详细说明:(参阅TC-LIWC注意事项)
1. TXT檔輸入格式為UTF-8
档案输入格式需为UTF8,请用户按此规格汇入档案。
2. 中文断词处理
我们建议使用:斯坦福大学分词系统(Stanford Word Segmenter〉,但是研究者还是可以依照自己的方便与喜好自行选择断词系统,关于斯坦福大学分词系统相关设定,请参考standford word segmenter说明
3. 断词后进入LIWC之前置处理方式
在进行SC_LIWC之分析前,文本除了断词处理之外,还需要针对标点符号进行转换(包括将全型标点符号转换为半型,并且让SC_LIWC能够辨识句子结束等)。
本研究团队已经发展可协助这部份文本处理之程序软件,并提供免费下载。请點選技術支援。
1. TXT檔輸入格式為UTF-8
档案输入格式需为UTF8,请用户按此规格汇入档案。
2. 中文断词处理
我们建议使用:斯坦福大学分词系统(Stanford Word Segmenter〉,但是研究者还是可以依照自己的方便与喜好自行选择断词系统,关于斯坦福大学分词系统相关设定,请参考standford word segmenter说明
3. 断词后进入LIWC之前置处理方式
在进行SC_LIWC之分析前,文本除了断词处理之外,还需要针对标点符号进行转换(包括将全型标点符号转换为半型,并且让SC_LIWC能够辨识句子结束等)。
本研究团队已经发展可协助这部份文本处理之程序软件,并提供免费下载。请點選技術支援。