UTF-8 中文编码范围

主流的匹配字符有两种 [\u4e00-\u9fa5]和[\u2E80-\u9FFF]，后者范围更广，包括了日韩地区的汉字

import re


pattern = re.compile("[\u2E80-\u9FFF]+")
result = pattern.findall('新浪微博')
print(result)

['新浪微博']

re

相关

关于sqlserver的where如何添加判断类语句的一种想法（只包含两个判断分支）

ClickHouse源码阅读笔记（二）之Interpreter介绍

ceph数据recovery配置策略（数据recovery流量控制）

WPF create Flower shape

stream classdesc serialVersionUID = -2405554363432379872, local class serialVers

CentOS7下Firewall常用命令

OracleDataReader.Read()耗时过高问题的解决办法

thread同步测试

一、Asp.Net Core WebAPI——修改默认监听端口

recokemq整合问题

.NetCore简单封装基于IHttpClientFactory的HttpClient请求

scala future 动态并行异步 ;promise jobs join item scala dynamic

标签