Articles of lxml

将python脚本转换为使用lxml的etree模块的linux二进制文件的问题

我在2013年9月基本上和这个人有同样的问题。 相关问题: Cx_freeze与lxml.html TypeError (有人通过编辑cx-freeze代码发现了一个修复,但没有深入解释), cx-freeze没有find所有的依赖关系 (不知道如何在Linux中打开egg) 我不能评论它,直到我有50的声誉,所以我发布了这个线程。 我正在使用cx_freeze的4.3.1来冻结下列模块: import sys import getopt from time import gmtime, strftime, time from os.path import exists from lxml import etree 我的setup.py脚本: import sys from cx_Freeze import setup, Executable #build_exe_options = {"packages": ["sys","getopt","time","os","lxml"]} build_exe_options = {"packages": ["sys","getopt","time","os","lxml","BeautifulSoup","lxml.html.soupparser","lxml.html.html5parser","lxml.html.diff","lxml.ElementInclude"]} setup( name = "cmpxml", version = "r13", description = "", options = […]

相同的xpath在Centos,Ubuntu上返回不同的值

我们正试图将我们的应用程序从Centos环境移植到其他Linux,特别是Ubuntu。 该应用程序是基于python的,所以应该没有问题,但是我们注意到在分析XPATH时有一个奇怪的行为。 示例文件: <root> <outer> <inner> <el/> </inner> <inner> <el/> </inner> </outer> </root> 码: from lxml import etree r = etree.parse('foo.xml') print 'One: ', r.xpath('.//el[2]') print 'Two: ', r.xpath('(.//el)[2]') 在Centos上(python 2.7.5): One: [<Element el at 0x25fdcf8>] New version: [<Element el at 0x25fdcf8>] 在RedHat Enterprise 6.6(python 2.7.11) One: [] Two: [<Element el at 0x7fa27198cd40>] 在Debian和Ubuntu上(python 2.7.9和2.7.12): […]

lxml.etree.tostring()中的缩进因Mac和Linux而异

Python的lxml.etree.tostring()在Mac和Linux上的缩进方式不同 – 缩进似乎是Linux上缩进的两倍。 这是炸毁我的unit testing。 显然lxml.etree不公开任何设置默认缩进值的path。 任何人都知道这里可能会发生什么? 编辑添加代码: 我确定代码是一样的,计算机通过github共享。 这里是testing代码: chk = """\ <field> <id>7135260</id> <name>lastname</name> <label>Last Name</label> <type/> </field>""" res = etree.tostring((xml_obj.xpath(xp_str))[0], pretty_print=True) self.assertMultiLineEqual( chk, res.rstrip() ) 这通过Linux,但在Mac上失败,与此错误报告: – <id>7135260</id> + <id>7135260</id> ? ++++++ – <name>lastname</name> + <name>lastname</name> ? ++++++ – <label>Last Name</label> + <label>Last Name</label> ? ++++++ – <type/> + <type/> ? ++++++ […]

在Fedora上运行python脚本时,没有名为lxml.html的模块

我试图在Fedora服务器上运行一个python脚本。 我收到以下错误。 /usr/bin/python report_generation.py Traceback (most recent call last): File "report_generation.py", line 9, in ? import lxml.html ImportError: No module named lxml.html 做一些研究,我发现它需要python-lxml包来运行脚本。 这台机器已经有一些lxml的安装。 但是,我无法做到这一点。 yum search libxml libxml2.i386 : Library providing XML and HTML support libxml2.x86_64 : Library providing XML and HTML support libxml2-devel.i386 : Libraries, includes, etc. to develop XML and HTML applications […]

Pypy:pip安装lxml

我正在尝试将pypy 2.6.1安装到虚拟环境中。 我按照这里的说明: http : //pypy.readthedocs.org/en/latest/install.html工作正常。 但麻烦的是当我试图安装一些其他的东西到virtualenv。 其中一个有lxml作为依赖,这就是发生了什么事情: src/lxml/lxml.etree.c:4276:68: error: 'PyThreadState' has no member named 'c_tracefunc' (tstate->c_profilefunc || (CYTHON_TRACE && tstate->c_tracefunc))) {\ ^ src/lxml/lxml.etree.c:34578:3: note: in expansion of macro '__Pyx_TraceCall' __Pyx_TraceCall("_htmlNameIsValid", __pyx_f[4], 1596, 0, {__pyx_filename = __pyx_f[4]; __pyx_lineno = 1596; __pyx_clineno = __LINE__; goto __pyx_L1_error;}); ^ src/lxml/lxml.etree.c:4284:26: error: 'PyThreadState' has no member named 'use_tracing' if […]

有没有可能使用Selenium / Python而不产生一个可见的窗口? 我可以使用lxml吗?

我希望能够保存一个页面,然后使用lxml.html.parse()但我想知道如果我可以直接从打开的页面上执行它? 我使用Ubuntu,如果它有任何区别。 编辑:有一种方法直接使用xpath(find_element_by_xpath),所以我想我不需要lxml。 但是要保存页面,你只需要调用page_source方法。

我如何在Amazon EC2 linux上安装lxml依赖项?

我试过了: sudo yum install libxml2-dev libxslt-dev python-dev 我得到了: Loaded plugins: priorities, update-motd, upgrade-helper amzn-main/latest | 2.1 kB 00:00 amzn-updates/latest | 2.3 kB 00:00 No package libxml2-dev available. No package libxslt-dev available. No package python-dev available. 点也没有工作。 我得到了这样的包: git clone –branch lxml-3.2.4 https://github.com/lxml/lxml 然后我尝试没有cython,因为sudo python setup.py install给了我RuntimeError: ERROR: Trying to build without Cython, but pre-generated 'src/lxml/lxml.etree.c' […]

如何在Win 7 64上安装libxml2 2.9.0 for lxml for Python 3.4.3?

我在Win 7 64计算机上使用Python 3.4的lxml 3.4.2。 我从http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml获得了lxml。 其中一个部分是libxml2 2.9.2。 我有一个问题,与libxml2 2.9.0 lxml 3.4.2用户没有,所以我想尝试libxml2 2.9.0,但不知道如何安装它。 有关这个问题的更多信息,请参阅Python 2 v。3 xpath 。 我没有能力从源头上编译。 我如何安装2.9.0?

在当前的visual studio 2013中运行visual studio 2008

如果可能的话,我可以使用Visual Studio 2008编译一些东西,如果我有Visual Studio 2013? 我想运行pip install lxml ,它给了我一个unable to find vcvarsall.bat错误。 所以我试过SET VS90COMNTOOLS=%VS120COMNTOOLS% 。 然后它给了我更多的错误和退出状态2.我该如何解决这个问题? 谢谢!

有没有离线安装lxml?

我有一个Windows 7机器连接到一个专用networking,没有互联网接入。 我需要在本机上安装lxml来编写一些脚本。 有没有离线安装lxml?