概述

rply 是一个 pythonlexer/parser 生成器,然而我知道它的原因是那个号称自主研发的木兰语言用了它。 这里是官方文档链接

利用它能很方便的解析字符串,由于某个玩具语言我还是稍微懂一点这套流程的。

目前这个工具基本完成,已经开源到 GitHub 上:https://github.com/kifuan/chemcalc

效果

README 的复制过来了:

1
2
3
4
5
6
7
8
9
10
> NaOH
40
> H2SO4
98
> 2HCl
73
> (NH4)2SO4
132
> CuSO4+5H2O
250

支持带化学计量数(也就是系数)的计算,方便大家使用。

相对原子质量

这个是我从化学课本和百度上扒下来的,并且四舍五入到中学常用的值,那么它就单纯的是一个字典而已,如下:

1
2
3
4
5
6
7
8
9
# elements.py
ELEMENTS = {
'H': 1,
'He': 4,
'Li': 7,
'Be': 9,
'B': 11,
# 省略若干行
}

Lexer

这里都是 Token 的伪代码,右边是正则表达式。

我们的规则还是比较简单的,几行足矣:

1
2
3
4
5
INTEGER = \d+
ELEMENT = [A-Z][a-z]?[a-z]?
OPEN_PARENS = \(
CLOSE_PARENS = \)
ADD = \+

Parser

这里只给出相应规则,具体实现还请找到 GitHub 仓库去看。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# 例如 C
ele: ELEMENT
# 例如 O2
ele: ELEMENT INTEGER

# 例如 (CO)
paren: OPEN_PARENS expr CLOSE_PARENS
# 例如 (NH4)2
paren: OPEN_PARENS expr CLOSE_PARENS INTEGER

expr: ele
expr: paren
expr: ele expr
expr: paren expr

# 这一行支持 CuSO4+5H2O 这种水合物
final_expr: final_expr ADD final_expr
final_expr: expr
final_expr: INTEGER expr

总结

看上去挺简单的,但是真实现起来还是花了我一番功夫。