你是否在处理文本数据时被字符串分割搞得头大?是否因为split()的“坑”导致程序报错?
今天,一篇搞定Python字符串分割的终极指南,建议收藏!
一、快速入门:split()能做什么?
假设你有一串文本: "用户A,用户B,用户C"
想拆成列表 ["用户A", "用户B", "用户C"],split()就是你的救星!
核心语法:
字符串.split(分隔符, 最大分割次数)
- 分隔符:按什么字符切分(默认按空格)
- 最大分割次数:切几刀,剩下的保留
str1 = "用户A, 用户B, 用户C"
print(str1.split(",")) # ['用户A', ' 用户B', ' 用户C']
二、高频场景:从入门到进阶
1. 基础用法:按空格切分
text = "Hello Python World"
print(text.split()) # 输出:['Hello', 'Python', 'World']
关键点:
- 默认自动合并连续空格/换行/制表符
- 自动忽略首尾空格!
2. 指定分隔符:处理CSV/日志
csv_data = "2023-08-01,订单A,成功"
print(csv_data.split(',')) # ['2023-08-01', '订单A', '成功']
注意坑点:
若分隔符连续出现,会产生空字符串!
text = "苹果,,橘子"
print(text.split(',')) # ['苹果', '', '橘子']
3. 限制分割次数:提取关键信息
log = "ERROR: 服务器崩溃 | 代码行: 123 | 时间: 2025-04-08"
# 只按第一个"|"分割
result = log.split(' | ', 1)
print(result) # ['ERROR: 服务器崩溃', '代码行: 123 | 时间: 2025-04-08']
适用场景:解析结构化文本,避免过度分割!
三、避坑指南:这些坑你踩过吗?
1. 空字符串的陷阱
若分隔符在开头/结尾,split()会生成空元素:
text = ",开头,中间,结尾,"
print(text.split(',')) # ['', '开头', '中间', '结尾', '']
解决方案:
用列表推导式过滤空值!
text = ",开头,中间,结尾,"
print(text.split(',')) # ['', '开头', '中间', '结尾', '']
clean_list = [x for x in text.split(',') if x]
print(clean_list) # ['开头', '中间', '结尾']
2. 想按单个字符切分?别用split()!
text = "ABC"
# 错误写法:text.split('') → 报错!
# 正确写法:
print(list(text)) # ['A', 'B', 'C']
3. 多行文本处理:split()不够用?
用 splitlines() 更专业!支持\n、\r、\r\n全兼容:
text = "第一行\n第二行\r\n第三行"
print(text.splitlines()) # ['第一行', '第二行', '第三行']
四、进阶技巧:正则表达式分割
复杂分隔符(如多个符号组合),用 re.split() 更高效!
import re
text = "价格:¥199;折扣=50%|库存=100"
result = re.split(r'[;|=:]', text)
print(result)
# 输出:['价格', '¥199', '折扣', '50%', '库存', '100']
你在使用split()时还遇到过哪些“坑”?欢迎留言讨论!
<script type="text/javascript" src="//mp.toutiao.com/mp/agw/mass_profit/pc_product_promotions_js?item_id=7490776992405619250"></script>