正則表達式匹配漢字

三日月綾香

匹配漢字的正則表達式如下 / The regex matching Chinese characters is as follows

[\u3006\u3007\u4e00-\u9fff\u3400-\u4dbf\U00020000-\U0002a6df\U0002a700-\U0002b73f\U0002b740-\U0002b81f\U0002b820-\U0002ceaf\U0002ceb0-\U0002ebef\U00030000-\U0003134f]

解釋 / Explanation

Python 程式碼示例 / Python code example

>>> import re
>>> han_regex = re.compile(r'[\u3006\u3007\u4e00-\u9fff\u3400-\u4dbf\U00020000-\U0002a6df\U0002a700-\U0002b73f\U0002b740-\U0002b81f\U0002b820-\U0002ceaf\U0002ceb0-\U0002ebef\U00030000-\U0003134f]')
>>> bool(han_regex.match('m'))
False
>>> bool(han_regex.match('!'))
False
>>> bool(han_regex.match('文'))
True
>>> bool(han_regex.match('𦫖'))
True