杜建军 发布的文章

如果你使用百度搜索“使用 python 运行 js 程序”之类的关键字,得到的结果无非是"pyv8","pyexecjs,","js2py","直接操作node"。
那么很遗憾,以上四种方案都很不ok。

我花费很长时间,查阅了大量资料,总结出一个道理:如果在百度里很长时间都找不到的答案,不妨去 Google 一下,使用英文关键字。

这里介绍的是 PyMiniRacer ,它是一个很棒的库,可以完美替代谷歌的 pyv8 ,让你在任何版本的Python里都能通过 pip 很轻松的安装。

PyMiniRacer 仓库

特点:轻,安装方便,使用v8引擎(快),可以记录上下文环境,项目在积极维护中

安装:pip install py_mini_racer
使用:(更多用法见github)

from py_mini_racer import py_mini_racer
ctx = py_mini_racer.MiniRacer()
ctx.eval("""
function escramble_758(){
    var a,b,c
    a='+1 '
    b='84-'
    a+='425-'
    b+='7450'
    c='9'
    return a+c+b;
}
""")
ctx.call("escramble_758")

分别介绍一下其他库的缺点:

pyv8

2013 年开始就不维护了,支持python2 和早期python3 ,对python版本有要求,安装难,安装了不一定能用。

pyexecjs

这个也不维护了,作者的话:“pyexecjs性能差,推荐大家去用性能更好的pyv8”
pyexecjs 本身依赖js运行环境.首先在python中调用pyexecjs,然后pyexecjs再去启动nodejs。性能差

js2py

这个库的核心是“将js 代码翻译成 py”,自然会缺失很多js的系统函数,最后出现很多奇怪的bug

dukpy

这个库是基于 duktape 引擎的,不支持 es6。可能会出现很多奇怪的bug


最后,可以在 https://stackoverflow.com/questions/10136319/executing-javascript-from-python 发现更多的 “在 python 中运行js”的答案

每次都百度,不如总结一起。方便复制粘贴

1. python 豆瓣源

 -i http://pypi.douban.com/simple/ --trusted-host=pypi.douban.com/simple

2. ubuntu 20 源

deb https://mirrors.ustc.edu.cn/ubuntu/ focal main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ focal main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ focal-security main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ focal-security main restricted universe multiverse
deb https://mirrors.ustc.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse
deb-src https://mirrors.ustc.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse

3. selenium

chrome 下载

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome*.deb
google-chrome --version

chromedriver下载路径:
http://npm.taobao.org/mirrors/chromedriver/

不会吧,不会吧。都21世纪了,还有不会用 composer 的 phper?

1. 创建composer.json文件

{
    "autoload":{
        "psr4":{},
        "psr0":{},
        "files":[],
        "classmap":[]
    }
}

自动加载文件的大致架构如上。

2.psr4加载

遵循psr4规范加载,不用在文件目录中体现命名空间。composer.json 格式如下

{
    "autoload": {
    "psr-4": {
      "App\\": "app"
    }
}

appDemoPsr4

<?php

namespace App;
class DemoPsr4
{
    public function __construct()
    {
        echo "psr4加载";
    }

}

public/index.php

<?php
require "../vendor/autoload.php";

// psr4 加载。
$p4 = new App\TestPsr4();

3. 生成自动加载文件

在运行测试前,要使用composer命令生成自动加载文件

composer dumpautoload

现在运行 index.php 。即可输出 “psr4加载” 字样

4. psr0 加载

当使用psr0规范时,需要在文件目录中创建一个和‘命名空间’名称相同的目录

composer.json

{
  "autoload": {
    "psr-4": {
      "App\\": "app"
    },
    "psr-0": {
      "Bpp\\": "bpp"
    }
  }
}

bpp/Bpp/DemoPsr0.php

<?php

namespace Bpp;
class DemoPsr0
{
    public function __construct()
    {
        echo "psr0自动加载。";
    }
}

public/index.php

<?php
require "../vendor/autoload.php";

$p4 = new App\TestPsr4();
$p0 = new Bpp\TestPsr0();

运行 composer dumpautoload 生成自动加载文件。
然后运行public/index.php,会发现 psr0 类中的输出语句执行了

5.classmap

classmap 后面是个数组,写一个目录进去。会扫描这个目录下所有的文件。生成一个 类与文件名对应的数组。可以不用遵循任何标准,可以不写命名空间,甚至类名和文件名不相同都行。

具体文件见文件 “classmap”文件夹下

6.files

上面方法都是加载‘类文件’,如果需要加载一个php文件,这个php文件里写的是函数。就要使用 files 字段了。

详细代码见文件,'helper.php'

代码地址:https://github.com/jianwi/composer_autoload.git

客户需求:

A、B、C、D选项→ABCD选项
A、B、C、D其他→A、B、C、D其他

选项不定

当选项后面是"选项"的时候,替换掉、后面是其他的时候,不替换

思路:

替换一般可以匹配分组或者直接匹配要替换的字符。因为选项是不定的,所以不能用分组。

那么,就匹配 "、" 吧。

" 、" 前面是字母,逆向环视:(?<=[A-Z])

必须以 字母+选项 结尾,正向环视: (?=.*?[A-Z]选项$)

于是得到正则表达式

(?<=[A-Z])、(?=.*?选项$)

需求发生变化:

$A$、$B$、$C$、$D$选项
$A$、$B$、$C$、$D$、$E$选项
$A$、$B$、$C$选项
替换掉 $和、

$A$、$B$、$C$、选项 ,这种不替换

要替换掉$ 不是简单修改几个符号就能解决的,

分三步:

  1. 每个字母前面都有一个$,匹配这个$。\$(?=[A-Z])
  2. 匹配字母后面的 $、 。(?<=[A-Z])\$、
  3. 匹配选项前面的 $ 。 \$(?=选项$)

每句最后边是 $选项。(?=.*\$选项$)

选项前面的 \$ 也要替换掉

得到正则表达式:

((\$(?=[A-Z])|(?<=[A-Z])\$、)(?=.*\$选项$)|\$(?=选项$))

把最后处理完的数据生成一个 excel 文件。这是一个很常见的需求,每次都百度去找很浪费时间。处理 excel 的库太多了。
我们使用 openpyxl

1. 安装 openpyxl

pip install openpyxl

2. 使用它

# 第一步肯定是把包导进来呀
import openpyxl

# 先建一个 workbook
wb = openpyxl.Workbook()

# 然后 active 它,后面用这个 active 对象添加数据
wb_act = wb.active

# 添加数据,使用 append 方法 ,参数是一个 list ,表示excel中的一行数据。
wb_act.append(['row1,col1','row1,col2'])
wb_act.append(['row2,col1', 'row2,col2'])

# 上面我们添加了两行数据,你也可以添加很多行的。

# 然后保存成 excel 文件吧,这时候用 wb 对象的 save 方法保存,参数是文件的名称。
wb.save("../output.xlsx")