杂项 · 2014年1月18日

应该要有个偏向自然语言的类正则表达式

  刚学习正则表达式时,就时常为它而皱眉头。正则表达式的规则繁复,甚至已有好几本只讲正则的出版书籍,而它的作用仅仅是简化了字符串组成规则的表达方式。
  而在你几年的编程生涯中,也许总共就用过不超过十种的正则表达式字符串,除了通常的输入判别,也只在适合的时机用上一两个正则。
  一个程序员真正用到正则表达式的机会,应该不如系统管理员。
  既然程序员使用的几率小,而系统管理员多,那实际上一个偏向自然语言的类正则表达式应该能更能让人接受。
  自然语言描述一个邮件地址的格式,也不过是“中间必定有个@符号,@左边是字母开头混有数字的字符串,@右边是个网址加域名“,看似长,其实你念给别人听,就花三四秒时间,别人也很容易理解,不需要什么高的数学基础。
  正则表达式和LISP一样,实际是更偏向于数学语言而不是自然语言。
  有个偏向自然语言的类正则表达方式,这也能降低系统管理员运维的门槛,提高效率。

  • 我所想象的工具原来已经有了: Nimble

Edited on 2014-03-25