我有一些HTML文件需要以MS Word文档格式分发(不要问!)。 我可以在OpenOffice中手动打开每个文件,然后另存为一个doc文件。 但是我有很多文件,所以我想自动化这个。 你知道吗?
虽然没有经过测试,但有pyuno包访问OpenOffice API和下面的程序显示了一些这样做的方式。
ooextract.py
一个命令行工具,从StarWriter文档中提取文本,html或pdf内容,并将其写入不同的文件或(可选)将其打印到stdout(grep您的办公文档)。
Abiword可以从命令行转换文件 。
我没有亲自尝试过将HTML转换为DOC,但是由于它支持这两种格式,所以似乎值得一试。
另外,RTF会不够好? HTML-> RTF有很多转换器 。