文档信息提取1--python安装


第一天

1、python 安装

http://doc.aidaxue.com/python-install/

选择Python 3.8.10 公司的电脑win7 家里的 win11

2、安装 Pycharm

https://zhuanlan.zhihu.com/p/53250337

3、读取word文档数据

1)安装python-docx包

pip install python-docx

开发环境提示没找到包 No module named 'docx'

首先确定python-docx包安装成功,依赖包lxml也有。

命令行里面正常可用,问题出在Pycharm

定位问题后,重新度娘 在pycharm中使用第三方包,要用pycharm自带导包工具

打开pycharm->File->settings->

python-docx 文档

https://python-docx.readthedocs.io/en/latest/index.html

至此,已经可以简单通过python简单读取和写入word文档信息。今天主要是环境搭建,比较简单。安装python-docx包时遇到一点小问题,刚开始用 No module named 'docx' 提示找解决方案一直没找到合适的。重新定位问题问题解决。

下一步根据python-docx 文档和其他资料,详细了解一下python-docx 文档的数据结构。