六级/考研单词(扩展)词表及过滤器


全部文件:https://files.cnblogs.com/files/blogs/714801/WordFilter.zip

abandon abandons abandoned abandoning abandonment
...
zoom zooms zooming zoomed

像abandon和zoom这样的词有3010个。新东方六级英语新大纲词汇表有5380个词。以它为蓝本,补充了考研单词(其实两者几乎一样),去掉了高频词(a, an都认识)。我下过个雅思背单词app,2~3000个词,头一个单词是so,so我马上卸了。

广泛地阅读,爱看啥看啥。不认识的查词典。要是每个不认识的背,嘿嘿,想太多了。

Ctrl-C复制全部,运行WordFilter.py,再Ctrl-V,粘贴出来的就是abandon和zoom这样的词,先把它们背住。最好能查下词典,看下完整释义,别煮夹生饭。能自如地用5380个单词写英文,没有想象中的那么容易。

代码上面那个.zip里有。

准备个文本文件,每次都贴在它里面,过段时间统计下次数(程序很好编),不会编程可用WPS Office里的表格,背自己领域内的高频词。这个也想多了,5000谈不到专业词汇,都是通用词。

 1 # 1. 到 https://npm.taobao.org/mirrors/python/3.9.9/python-3.9.9-amd64.exe 下载python, 有些下载网站给你装堆乱七八糟的stuff
 2 # 2. 新建快捷方式时,要指定起始位置,如D:\WordFilter,即在该目录下运行WordFilter.py, which在当前目录下找*.txt
 3 # 3. 先Ctrl-C 复制txt,再运行WordFilter.py过滤,然后再Ctrl-V粘贴
 4 # 4. 可以Win-R,cmd <回车>可打开命令提示符
 5 # -*- coding: utf-8 -*-
 6 import glob
 7 import re
 8 # pip install pywin32
 9 import win32clipboard as w
10 import win32con
11 
12 def get_text():
13     w.OpenClipboard()
14     s = w.GetClipboardData(win32con.CF_UNICODETEXT)
15     w.CloseClipboard()
16     return s
17     
18 def set_text(s):
19     w.OpenClipboard()
20     w.EmptyClipboard()
21     #w.SetClipboardData(win32con.CF_TEXT, s.encode('utf-16le'))
22     w.SetClipboardData(win32con.CF_UNICODETEXT, s)
23     w.CloseClipboard()
24 
25 dic = {}
26 for file_name in glob.glob('*.txt'):
27     print(file_name)
28     with open(file_name, 'r', encoding='utf-8') as f:
29         # abandon abandons abandoned abandoning abandonment
30         # ...
31         # zoom zooms zooming zoomed
32         for line in f:
33             words = line.split()
34             kw = words[0].lower()
35             for word in words:
36                 if len(word) > 13: print(word)
37                 dic[word.lower()] = kw
38 print('\n')
39 
40 out = '六级/考研单词: '
41 odic = {}
42 words = re.split('[^a-zA-z-]', get_text())
43 for word in words:
44     word = dic.get(word.lower())
45     if word != None and odic.get(word) == None:
46         odic[word] = True
47         out += word + ', '
48 
49 try:
50     out = out[:out.rindex(',')]
51     print(out)
52     set_text(out)
53 except Exception:
54     exit()

得 pip install pywin32 , 操作剪贴板用。国外的源慢。

 Python pip配置国内源 - 暮光微凉 - 博客园 (cnblogs.com)

没人想写个C++版,带 SetClipboardViewer 功能吗?或者javascript给浏览器写个插件?现在电脑很快,把那些词写在源文件里,跑起来一点都不慢,我干过相近的事。