Python读取指定目录下指定后缀文件并保存为docx

admin 2018年5月13日01:18:45评论391 views字数 989阅读3分17秒阅读模式
摘要

最近有个奇葩要求 要项目中的N行代码 申请专利啥的
然后作为程序员当然不能复制粘贴 用代码解决。。

最近有个奇葩要求 要项目中的N行代码 申请专利啥的
然后作为程序员当然不能复制粘贴 用代码解决。。

使用python-docx读写docx文件

环境使用python3.6.0
首先pip安装python-docx

pip install python-docx

然后下面是脚本 修改目录,这里默认取脚本运行目录下的src文件夹
.cs后缀的所有文件 读取并保存为docx

有一点需要注意,如果文件中有中文,请用vscode或者其他编辑器使用utf-8格式打开,看看有没有乱码 其中每处理一个文件都会有print输出 当看到只有---start没有end的时候就可以找到该文件查看是否有上面说的情况,修改后保存重新执行,一直到全部执行完毕,保存好docx文件

代码

# -- coding: UTF-8 -- # Created by luody on 2017/4/7.  import os from docx import Document  saveFile = os.getcwd() + "/code.docx" mypath = os.getcwd() + "/src"  doc = Document() doc.add_heading("代码文档", 0) p = doc.add_paragraph('服务端代码,使用语言') p.add_run('C#,SQL').bold = True lineNum = 0 for root, dirs, files in os.walk(mypath):     for filespath in files:         if (filespath.endswith('.cs')):             doc.add_heading(filespath, level=1)             codePage = ''             print(filespath+' ----  start')             for line in open(os.path.join(root, filespath), encoding="utf-8"):                 codePage += line                 lineNum += 1             print(filespath+' ----  end')             doc.add_paragraph(codePage, style='IntenseQuote')             doc.add_page_break() p = doc.add_paragraph(u'总行数:') p.add_run(str(lineNum)).bold = True doc.save('code.docx') print(lineNum) 

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2018年5月13日01:18:45
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   Python读取指定目录下指定后缀文件并保存为docxhttp://cn-sec.com/archives/51437.html

发表评论

匿名网友 填写信息