Unicode

来自百合仙子's Wiki
跳转到导航 跳转到搜索

Unicode Category

Unicode Category 根据字符的性质分类。

字符被分为如下几类[1]

  • Lu - uppercase letters
  • Ll - lowercase letters
  • Lt - titlecase letters
  • Lm - modifier letters
  • Lo - other letters
  • Nl - letter numbers
  • Mn - nonspacing marks
  • Mc - spacing combining marks
  • Nd - decimal numbers
  • Pc - connector punctuations
  • Other_ID_Start - explicit list of characters in PropList.txt to support backwards compatibility
  • Other_ID_Continue - likewise

Unicode Script

Unicode Script 根据语种分类。[2]

数据文件在 http://www.unicode.org/Public/UNIDATA/Scripts.txt这里有一个 Python 版的类别查询库。[3]


参见

外部链接

在线工具

caveats

参考资料