概述
rply
是一个 python
的 lexer/parser
生成器,然而我知道它的原因是那个号称自主研发的木兰语言用了它。 这里是官方文档链接。
利用它能很方便的解析字符串,由于某个玩具语言我还是稍微懂一点这套流程的。
目前这个工具基本完成,已经开源到 GitHub
上:https://github.com/kifuan/chemcalc
效果
把 README
的复制过来了:
> NaOH
40
> H2SO4
98
> 2HCl
73
> (NH4)2SO4
132
> CuSO4+5H2O
250
支持带化学计量数(也就是系数)的计算,方便大家使用。
相对原子质量
这个是我从化学课本和百度上扒下来的,并且四舍五入到中学常用的值,那么它就单纯的是一个字典而已,如下:
# elements.py
ELEMENTS = {
'H': 1,
'He': 4,
'Li': 7,
'Be': 9,
'B': 11,
# 省略若干行
}
Lexer
这里都是 Token 的伪代码,右边是正则表达式。
我们的规则还是比较简单的,几行足矣:
INTEGER = \d+
ELEMENT = [A-Z][a-z]?[a-z]?
OPEN_PARENS = \(
CLOSE_PARENS = \)
ADD = \+
Parser
这里只给出相应规则,具体实现还请找到 GitHub 仓库去看。
# 例如 C
ele: ELEMENT
# 例如 O2
ele: ELEMENT INTEGER
# 例如 (CO)
paren: OPEN_PARENS expr CLOSE_PARENS
# 例如 (NH4)2
paren: OPEN_PARENS expr CLOSE_PARENS INTEGER
expr: ele
expr: paren
expr: ele expr
expr: paren expr
# 这一行支持 CuSO4+5H2O 这种水合物
final_expr: final_expr ADD final_expr
final_expr: expr
final_expr: INTEGER expr
总结
看上去挺简单的,但是真实现起来还是花了我一番功夫。