Python 如何像 awk一样分割字符串?

admin 2020年8月28日09:36:50评论299 views字数 1082阅读3分36秒阅读模式
来自公众号:Python编程时光

本篇选自 Python黑魔法指南 -> 第一章 -> 第31节

github仓库: https://github.com/iswbm/magic-python

magic-python 目前已经有 900+ 的 star 了,越来越多的人知道了它,从百度网盘的数据来看,已经有 将近 6000 的人下载了这本电子书。

--   正文开始  --



Python 如何像 awk一样分割字符串?

若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。

[root@localhost ~]# cat demo.txt
hello      world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world

可是转换到 Python 上面来呢?结果可能是这样的。

>>> msg='hello    world'
>>> msg.split(' ')
['hello''''''''world']

与我预想的结果不符,多个空格会被分割多次。

那有什么办法可以达到 awk 一样的效果呢?

有两种方法。

第一种方法

不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。

>>> msg='hello    world'
>>> msg.split()
['hello''world']

第二种方法

使用 filter 来辅助,这种适用于所有的分隔符,下面以 - 为分隔符来举例。

>>> msg='hello----world'
>>> msg.split('-')
['hello''''''''world']
>>>
>>> filter(None, msg.split('-'))
['hello''world']

是不是很神奇,filter 印象中第一个参数接收的是 函数,这里直接传 None 居然有奇效。

查看了注释,原来是这个函数会适配 None 的情况,当第一个参数是None的时候,返回第二个参数(可迭代对象)中非空的值,非常方便。

Python 如何像 awk一样分割字符串?

换用函数的写法,可以这样

>>> msg='hello----world'
>>> msg.split('-')
['hello''''''''world']
>>>
>>> filter(lambda item: True if item else False, msg.split('-'))
['hello''world']



●输入m获取文章目录

推荐↓↓↓

Python 如何像 awk一样分割字符串?

人工智能与大数据技术

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2020年8月28日09:36:50
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   Python 如何像 awk一样分割字符串?https://cn-sec.com/archives/108116.html

发表评论

匿名网友 填写信息