20赞

截断一个字符串而不在一个单词的中间结束

作者：U友50081205_653 | 2023-09-03 14:05

如何解决《截断一个字符串而不在一个单词的中间结束》经验，为你挑选了5个好方法。

我正在寻找一种方法来截断Python中的字符串,该字符串不会切断单词中间的字符串.

例如:

Original:          "This is really awesome."
"Dumb" truncate:   "This is real..."
"Smart" truncate:  "This is really..."

我正在寻找一种从上面完成"智能"截断的方法.

1> Adam..：

我实际上是在最近的一个项目中为此写了一个解决方案.我把它的大部分压缩到了一点点.

def smart_truncate(content, length=100, suffix='...'):
    if len(content) <= length:
        return content
    else:
        return ' '.join(content[:length+1].split(' ')[0:-1]) + suffix

会发生什么是if语句检查您的内容是否已经小于截止点.如果不是,它会截断到所需的长度,在空格上分割,删除最后一个元素(这样你就不会切断一个单词),然后将它连接在一起(同时加上'...') .

截断必须考虑后缀长度:`return''.join(content [:length + 1-len(suffix)].split('')[0:-1])+ suffix`

2> bobince..：

这是Adam解决方案中最后一行的稍微好一点的版本:

return content[:length].rsplit(' ', 1)[0]+suffix

(这稍微更有效,并且在字符串前面没有空格的情况下返回更合理的结果.)

所以我们可以肯定,结果字符串不会超过length:`如果len(内容)<= length,则返回内容内容[:length-len(suffix)].rsplit('',1)[0] +后缀`

3> Brian..：

有一些细微之处可能会或可能不是你的问题,例如标签的处理(例如,如果你将它们显示为8个空格,但在内部将它们视为1个字符),处理各种风格的破坏和非打破空格,或允许打破连字符等.如果需要这样做,您可能需要查看textwrap模块.例如:

def truncate(text, max_size):
    if len(text) <= max_size:
        return text
    return textwrap.wrap(text, max_size-3)[0] + "..."

大于max_size的单词的默认行为是打破它们(使max_size成为硬限制).您可以通过将break_long_words = False传递给wrap()来更改为此处某些其他解决方案使用的软限制,在这种情况下,它将返回整个单词.如果您想要此行为,请将最后一行更改为:

    lines = textwrap.wrap(text, max_size-3, break_long_words=False)
    return lines[0] + ("..." if len(lines)>1 else "")

根据您想要的确切行为,还有一些其他选项,如expand_tabs可能会引起您的兴趣.

4> Markus Jarde..：

def smart_truncate1(text, max_length=100, suffix='...'):
    """Returns a string of at most `max_length` characters, cutting
    only at word-boundaries. If the string was truncated, `suffix`
    will be appended.
    """

    if len(text) > max_length:
        pattern = r'^(.{0,%d}\S)\s.*' % (max_length-len(suffix)-1)
        return re.sub(pattern, r'\1' + suffix, text)
    else:
        return text

要么

def smart_truncate2(text, min_length=100, suffix='...'):
    """If the `text` is more than `min_length` characters long,
    it will be cut at the next word-boundary and `suffix`will
    be appended.
    """

    pattern = r'^(.{%d,}?\S)\s.*' % (min_length-1)
    return re.sub(pattern, r'\1' + suffix, text)

要么

def smart_truncate3(text, length=100, suffix='...'):
    """Truncates `text`, on a word boundary, as close to
    the target length it can come.
    """

    slen = len(suffix)
    pattern = r'^(.{0,%d}\S)\s+\S+' % (length-slen-1)
    if len(text) > length:
        match = re.match(pattern, text)
        if match:
            length0 = match.end(0)
            length1 = match.end(1)
            if abs(length0+slen-length) < abs(length1+slen-length):
                return match.group(0) + suffix
            else:
                return match.group(1) + suffix
    return text

5> Antonio..：

>>> import textwrap
>>> textwrap.wrap('The quick brown fox jumps over the lazy dog', 12)
['The quick', 'brown fox', 'jumps over', 'the lazy dog']

你只需要采取第一个要素,你就完成了......

`textwrap.shorten("Hello world",width = 10,placeholder ="...")`会生成`"Hello ..."`https://docs.python.org/3.5/library/textwrap.html

推荐阅读

程序员
立即窗口中的F#

如何解决《立即窗口中的F#》经验，为你挑选了0个好方法。 ... [详细]
程序员
不可能在Firefox中使用Twitter时间线？

如何解决《不可能在Firefox中使用Twitter时间线？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么angular.forEach上下文？

如何解决《为什么angular.forEach上下文？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony安装缺少的供应商库

如何解决《Symfony安装缺少的供应商库》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中使用递归来反转列表

如何解决《在python中使用递归来反转列表》经验，为你挑选了2个好方法。 ... [详细]
程序员
禁用在PM2中重新启动

如何解决《禁用在PM2中重新启动》经验，为你挑选了1个好方法。 ... [详细]
程序员
ESAPI - 使用禁止的依赖项获取NoClassDefFoundError(LoggerFactory)

如何解决《ESAPI-使用禁止的依赖项获取NoClassDefFoundError(LoggerFactory)》经验，为你挑选了1个好方法。 ... [详细]
程序员
JAXB不会为枚举生成枚举

如何解决《JAXB不会为枚举生成枚举》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Android HTML5播放器中开始播放所需的用户手势

如何解决《在AndroidHTML5播放器中开始播放所需的用户手势》经验，为你挑选了0个好方法。 ... [详细]
程序员
ImportError:动态模块没有定义模块导出函数(PyInit__caffe)

如何解决《ImportError:动态模块没有定义模块导出函数(PyInit__caffe)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bash提示脚本

如何解决《Bash提示脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
水平RecyclerView与开始填充

如何解决《水平RecyclerView与开始填充》经验，为你挑选了2个好方法。 ... [详细]
程序员
UIStackview具有不同对齐的子视图

如何解决《UIStackview具有不同对齐的子视图》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用Laravel将身份验证从一个用户切换到另一个用户

如何解决《如何使用Laravel将身份验证从一个用户切换到另一个用户》经验，为你挑选了0个好方法。 ... [详细]
程序员
微服务:分解基于图形数据库的应用程序

如何解决《微服务:分解基于图形数据库的应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
Facebook Instant Articles错误"HTML元素不包含任何文本:避免包含空HTML元素"

如何解决《FacebookInstantArticles错误"HTML元素不包含任何文本:避免包含空HTML元素"》经验，为你挑选了1个好方法。 ... [详细]
程序员
在卫兵中使用功能时的二郎"非法守卫表达"

如何解决《在卫兵中使用功能时的二郎"非法守卫表达"》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加剂,半添加剂和非添加剂措施之间的区别是什么

如何解决《添加剂,半添加剂和非添加剂措施之间的区别是什么》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Composer安装高级Wordpress主题

如何解决《使用Composer安装高级Wordpress主题》经验，为你挑选了0个好方法。 ... [详细]
程序员
关于C++中的复制控制

如何解决《关于C++中的复制控制》经验，为你挑选了1个好方法。 ... [详细]

U友50081205_653

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章