python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':
来源:学生作业帮助网 编辑:作业帮 时间:2024/06/28 10:30:51
![python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':](/uploads/image/z/10692931-67-1.jpg?t=python%E7%BB%9F%E8%AE%A1%E4%B8%AA%E5%8D%95%E8%AF%8D%E6%95%B0%E7%9B%AE%E8%A6%81%E6%B1%82%E6%98%AFget_word_frequencies%28file_name%29+%E6%89%93%E5%BC%80%E4%BA%86FILE+NAME%E8%BF%99%E6%96%87%E4%BB%B6%E5%90%8E%E8%BF%90%E7%94%A8dictionary%E7%BB%9F%E8%AE%A1%E5%87%BA%E6%96%87%E7%AB%A0%E4%B8%AD%E5%90%84%E5%8D%95%E8%AF%8D%E7%9A%84%E6%95%B0%E7%9B%AE+%E6%95%88%E6%9E%9C%E5%A6%82%E4%B8%8B%EF%BC%9A%7B%27all%27%3A1%2C%27forget%27%3A1%2C%27-%27%3A3%2C%27years%27%3A1%2C%27proposition%27%3A1%2C%27continent%27%3A1%2C%27liberty%2C%27%3A1%2C%27We%27%3A)
python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':
python统计个单词数目
要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:
{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':2,...
PS:‘-’这种不属于单词的东西不要统计在内
python统计个单词数目要求是get_word_frequencies(file_name) 打开了FILE NAME这文件后运用dictionary统计出文章中各单词的数目 效果如下:{'all':1,'forget':1,'-':3,'years':1,'proposition':1,'continent':1,'liberty,':1,'We':
楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等.
请问楼主要区分大小写吗?如果区分的话,就按照下面的来:
import re
def get_word_frequencies(file_name):
\x09dic = {}
\x09txt = open(filename, 'r').read().splitlines()
\x09#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中.
\x09txt = re.sub(r'[^\u4e00-\u94a5\w\d\-]', ' ', txt)
\x09#替换单独的'-'
\x09txt = re.sub(r' - ', ' ', txt)
\x09for line in :
\x09\x09for word in line.split():
\x09\x09#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(), 0)
\x09\x09\x09dic.setdefault(word, 0)
\x09\x09\x09dic[word] += 1
\x09print dic
\x09
if __name__ = '__main__':
\x09get_word_frequencies('test.txt')
有问题继续追问吧