IDC

盘点3个可以操作JavaScript的Python库

作者:admin 2021-04-23 我要评论

前言 我们都知道Python可以很轻松的实现某些功能,而且还可以编写网页,比如Remi,Pysimplegui,但是操作JavaScript这种浏览器的脚本语言,还是第一次听说,小编...

在说正事之前,我要推荐一个福利:你还在原价购买阿里云、腾讯云、华为云服务器吗?那太亏啦!来这里,新购、升级、续费都打折,能够为您省60%的钱呢!2核4G企业级云服务器低至69元/年,点击进去看看吧>>>)

前言

我们都知道Python可以很轻松的实现某些功能,而且还可以编写网页,比如Remi,Pysimplegui,但是操作JavaScript这种浏览器的脚本语言,还是第一次听说,小编也是第一次听说,于是就跟大家脑补这一知识。

一、PyExecJS

是一个可以执行JavaScript脚本的Python模块,可以与网页上的JavaScript进行交互,这样就能更加精准的获取到网页中的加密内容,如果用Python中的网络模块进行请求,会无法解密文档中的加密内容,这个时候使用我们的PyExecJS可以很方便到的解密网页中的加密内容,当然这得你会Js逆向才可以。不过要想PyExecJS解析JS语句没毛病,还得整个Js语言解析环境,这里推荐NodeJS,尴尬。我们来看下PyExecJs的用法:

1.常规操作

  1. import execjs 
  2. aa=execjs.eval("'one|two|three'.split('|')") #执行JavaScript代码,将字符串分割形成数组 
  3. print(aa)  
  4.  
  5. e=execjs.compile('''     #编译一个表达式 
  6. function add(x,y){ 
  7.   return x+y; 
  8. ''') 
  9. print(e.call('add',10,20))#调用编译好的函数并且赋值 

也可以通过获取引擎来运行我们的语句,如下:

  1. print(execjs.get().eval('1+1')) 

2.查看解释引擎

  1. print(execjs.get().name

这里JavaScript的解释引擎是JScript,我们还可以使用自己指定给力的引擎,比如“Nodejs”。

3.指定引擎

  1. import execjs 
  2. import os 
  3. os.environ["EXECJS_RUNTIME"] = "Node" 
  4. print(execjs.get().name

也可以手动指定引擎,如下:

  1. js1=execjs.get(execjs.runtime_names.JScript) 
  2. print(js1.eval('1')) 
  3.  
  4. js2=execjs.get(execjs.runtime_names.Node) 
  5. print(js2.eval('2')) 

二、Js2Py

这个我觉得算是比较好的了,可以说是一个综合体,它不需要依赖别的环境,可以独立运行Js文件,只不过它的运行速度可能会稍微慢一点而已,但是这都不叫事。下面我们来看看它有哪些神器的功能吧。

1.常规操作,必须的

2.循环遍历

  1. import js2py 
  2. aa=js2py.eval_js( 
  3. ''
  4. var i=0; 
  5. for(var c=1;c<6;c++){ 
  6. console.log(c); 
  7.  
  8. ''
  9. print(aa) 

3.读取Js文件

我们可以把JS文件写入文件中,以便我们进行调用,如下:

1.js

  1. function f(aa){ 
  2.     if(aa>11){ 
  3.         console.log('OK'
  4.  
  5.     }else
  6.         console.log('Fail'
  7.   } 

Python文件

  1. import  js2py 
  2. with open('1.js','r'as f: 
  3.     aa=js2py.eval_js(f.read()) 
  4.     print(aa(11)) 

4.爬取网站数据

这里我们以淘宝为主,我想整它的JS脚本文件,如下:

  1. import execjs 
  2. import requests 
  3. import re 
  4. url = 'https://ai.taobao.com/?pid=mm_26632323_6762370_25910879' 
  5. res=requests.get(url).text 
  6. js=re.findall(r'<script>(.*?)</script>',res) 
  7. print(js,'\n'
  8. js1=re.sub(r'eval\(','return(',js[0]) 
  9. html="function getLego2WPK(){" + js1 + "};" 
  10. ctx = execjs.compile(html) 
  11. temp = ctx.call('getLego2WPK'
  12. print(temp

三、PyV8

基于Google的V8引擎打造,遗憾的是目前只支持Python2版本,而且已不再维护,建议Python2的小伙伴可以去试试。

四、总结

本文主要盘点了3个可以操作JavaScript的Python库,分别是PyExecJS、Js2Py和PyV8,只要我们用好了这些模块以后玩爬虫就能更加技高一筹,并且准确率更高了。


本文转载自网络,原文链接:https://mp.weixin.qq.com/s/3obHCfpNqdtCguQO2DpZCw

版权声明:本文转载自网络,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本站转载出于传播更多优秀技术知识之目的,如有侵权请联系QQ/微信:153890879删除

相关文章
  • Sedo:深圳终端13万元收购tcmm.com!新

    Sedo:深圳终端13万元收购tcmm.com!新

  • 域名对企业的重要性有哪些?

    域名对企业的重要性有哪些?

  • 球星都爱新后缀?罗布-格隆考斯基启用

    球星都爱新后缀?罗布-格隆考斯基启用

  • .com域名明年开始调价!涨幅将高达22.5

    .com域名明年开始调价!涨幅将高达22.5

腾讯云代理商
海外云服务器