15赞

如何用链接替换普通URL？

作者：放ch养奶牛 | 2023-09-05 21:57

如何解决《如何用链接替换普通URL？》经验，为你挑选了10个好方法。

我使用下面的函数来匹配给定文本中的URL并替换它们用于HTML链接.正则表达式工作得很好,但目前我只是替换了第一场比赛.

我如何替换所有的URL？我想我应该使用exec命令,但我并没有真正想到如何做到这一点.

function replaceURLWithHTMLLinks(text) {
    var exp = /(\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/i;
    return text.replace(exp,"$1"); 
}

Dan Dascales.. 336

首先,滚动自己的正则表达式来解析URL是一个糟糕的主意.根据RFC,你必须想象这是一个常见的问题,有人为它编写,调试和测试了一个库.URI很复杂 - 请查看Node.js中的URL解析代码和URI方案的Wikipedia页面.

在解析URL方面有很多边缘案例:国际域名,实际(.museum)与不存在(.etc)TLD,包括括号的奇怪标点符号,URL末尾的标点符号,IPV6主机名等.

我已经看了一吨的图书馆,并有几个值得使用,尽管一些缺点:

Soapbox的linkify已经看到了一些认真的努力,并且2015年6月的一个主要重构删除了jQuery依赖.它仍然存在IDN问题.

AnchorMe是一个声称更快,更精简的新手.一些IDN问题也是如此.

Autolinker.js非常具体地列出了功能(例如"将正确处理HTML输入.该实用程序不会更改hrefanchor()标记内的属性").当演示可用时,我会对它进行一些测试.

我已经快速取消了这项任务资格的图书馆:

Django的urlize 没有正确处理某些TLD(这是有效TLD的官方列表.没有演示.

如果没有http://,autolink-js将无法检测到"www.google.com",因此它不太适合自动链接纯文本中的"临时URL"(没有方案/协议).

Ben Alman的linkify自2009年以来一直没有得到维护.

如果你坚持使用正则表达式,那么最全面的是来自Component的URL regexp,尽管它会通过查看错误地检测到一些不存在的双字母TLD.

1> Dan Dascales..：

在解析URL方面有很多边缘案例:国际域名,实际(.museum)与不存在(.etc)TLD,包括括号的奇怪标点符号,URL末尾的标点符号,IPV6主机名等.

我已经看了一吨的图书馆,并有几个值得使用,尽管一些缺点:

Soapbox的linkify已经看到了一些认真的努力,并且2015年6月的一个主要重构删除了jQuery依赖.它仍然存在IDN问题.

AnchorMe是一个声称更快,更精简的新手.一些IDN问题也是如此.

Autolinker.js非常具体地列出了功能(例如"将正确处理HTML输入.该实用程序不会更改hrefanchor()标记内的属性").当演示可用时,我会对它进行一些测试.

我已经快速取消了这项任务资格的图书馆:

Django的urlize 没有正确处理某些TLD(这是有效TLD的官方列表.没有演示.

如果没有http://,autolink-js将无法检测到"www.google.com",因此它不太适合自动链接纯文本中的"临时URL"(没有方案/协议).

Ben Alman的linkify自2009年以来一直没有得到维护.

如果你坚持使用正则表达式,那么最全面的是来自Component的URL regexp,尽管它会通过查看错误地检测到一些不存在的双字母TLD.

遗憾的是,来自Component的"URL regexp"没有被评论,对它正在做什么的一些解释会有所帮助.`Autolinker.js`评论很好并且有测试.在[Vebjorn Ljosa的答案](http://stackoverflow.com/a/10498205/2541)中链接的`urlize.js`库看起来也很有特色并且维护得很好,尽管它没有测试.

很奇怪没有人提到John Gruber维护[URL正则表达式模式]的努力(http://daringfireball.net/2010/07/improved_regex_for_matching_urls).它不是解决问题的唯一/理想解决方案,但无论如何都值得研究,如果您正在推出自己的解决方案.只想添加此作为参考.

@DanDascalescu看看这个http://markdown-it.github.io/linkify-it/.该库完全专注于一项任务 - 检测文本中的链接模式.但我希望,它做得很好.例如,它具有正确的unicode支持,包括星体字符.它支持国际顶级域名.

2> Sam Hasler..：

用链接替换URL(回答一般问题)

问题中的正则表达式错过了很多边缘情况.在检测URL时,最好使用专门的库来处理国际域名,新的顶级域名(如TLD).museum,括号和URL末尾的其他标点符号以及许多其他边缘情况.有关其他一些问题的解释,请参阅Jeff Atwood的博客文章The URL with URL.

URL匹配库的最佳摘要在Dan Dascalescu的答案中
(截至2014年2月)

"使正则表达式替换多个匹配"(具体问题的答案)

在正则表达式的末尾添加"g"以启用全局匹配:

/ig;

但这只能解决正则表达式只替换第一个匹配的问题.不要使用该代码.

3> 小智..：

我对Travis的代码进行了一些小修改(只是为了避免任何不必要的重新声明 - 但它对我的需求非常有用,非常好!):

function linkify(inputText) {
    var replacedText, replacePattern1, replacePattern2, replacePattern3;

    //URLs starting with http://, https://, or ftp://
    replacePattern1 = /(\b(https?|ftp):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/gim;
    replacedText = inputText.replace(replacePattern1, '$1');

    //URLs starting with "www." (without // before it, or it'd re-link the ones done above).
    replacePattern2 = /(^|[^\/])(www\.[\S]+(\b|$))/gim;
    replacedText = replacedText.replace(replacePattern2, '$1$2');

    //Change email addresses to mailto:: links.
    replacePattern3 = /(([a-zA-Z0-9\-\_\.])+@[a-zA-Z\_]+?(\.[a-zA-Z]{2,6})+)/gim;
    replacedText = replacedText.replace(replacePattern3, '$1');

    return replacedText;
}

代码中存在与此处的电子邮件地址匹配的错误.`[a-zA-Z] {2,6}`应该读一下`(？:[a-zA-Z] {2,6})+`的内容,以便匹配更复杂的域名,即email@example.co.uk.

我希望我可以给你一个以上的upvote :)

我尝试编辑原始帖子来修复mailto问题,但我必须添加至少6个字符才能进行编辑.但是如果你改变这一行:`replacePattern3 = /(\ w + @ [a-zA-Z _] +？\.[a-zA-Z] {2,6})/ gim;`用这个`replacePattern3 = /(\w + @ [a-zA-Z _] +？(\.[a-zA-Z] {2,6})+)/ gim;`修复了mailto问题:)

4> Roshambo..：

对Travis的Linkify()代码进行了一些优化.我还修复了一个错误,即子域类型格式的电子邮件地址不匹配(即example@domain.co.uk).

另外,我将实现更改为String类的原型,以便可以像这样匹配项:

var text = 'address@example.com';
text.linkify();

'http://stackoverflow.com/'.linkify();

无论如何,这是脚本:

if(!String.linkify) {
    String.prototype.linkify = function() {

        // http://, https://, ftp://
        var urlPattern = /\b(?:https?|ftp):\/\/[a-z0-9-+&@#\/%?=~_|!:,.;]*[a-z0-9-+&@#\/%=~_|]/gim;

        // www. sans http:// or https://
        var pseudoUrlPattern = /(^|[^\/])(www\.[\S]+(\b|$))/gim;

        // Email addresses
        var emailAddressPattern = /[\w.]+@[a-zA-Z_-]+?(?:\.[a-zA-Z]{2,6})+/gim;

        return this
            .replace(urlPattern, '$&')
            .replace(pseudoUrlPattern, '$1$2')
            .replace(emailAddressPattern, '$&');
    };
}

5> Travis..：

谢谢,这非常有帮助.我还想要一些可以链接看似URL的东西的东西 - 作为一个基本要求,即使http://协议前缀不存在,它也会像www.yahoo.com这样链接.所以基本上,如果"www." 它存在,它将链接它并假设它是http://.我还希望电子邮件变成mailto:links.示例:www.yahoo.com将转换为www.yahoo.com

这是我最终得到的代码(这个页面的代码和我在网上找到的其他东西的组合,以及我自己做的其他东西):

function Linkify(inputText) {
    //URLs starting with http://, https://, or ftp://
    var replacePattern1 = /(\b(https?|ftp):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/gim;
    var replacedText = inputText.replace(replacePattern1, '$1');

    //URLs starting with www. (without // before it, or it'd re-link the ones done above)
    var replacePattern2 = /(^|[^\/])(www\.[\S]+(\b|$))/gim;
    var replacedText = replacedText.replace(replacePattern2, '$1$2');

    //Change email addresses to mailto:: links
    var replacePattern3 = /(\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,6})/gim;
    var replacedText = replacedText.replace(replacePattern3, '$1');

    return replacedText
}

在第二次替换中,(^ | [^ /])部分仅替换www.whatever.com,如果它还没有前缀为// - 以避免在第一次替换中已经链接了URL时进行双重链接.此外,www.whatever.com可能位于字符串的开头,这是正则表达式中该部分的第一个"或"条件.

这可以作为jQuery插件集成,如上面所示的Jesse P - 但我特别想要一个不在现有DOM元素上运行的常规函数,因为我正在使用我拥有的文本然后将它添加到DOM中,我希望在添加文本之前将文本"链接",因此我将文本传递给此函数.效果很好.

我只是在一个字符串上运行它,其中一些web链接已经有一个href链接.在这种情况下,它无法搞乱现有的工作链接.

6> Vebjorn Ljos..：

识别URL很棘手,因为它们通常被标点符号包围,并且因为用户经常不使用URL的完整形式.存在许多JavaScript函数用于替换带有超链接的URL,但是我无法找到一个urlize与基于Python的Web框架Django中的过滤器一样好的函数.因此我将Django的urlize函数移植到JavaScript:

https://github.com/ljosa/urlize.js

一个例子:

urlize('Go to SO (stackoverflow.com) and ask. ', 
       {nofollow: true, autoescape: true})
=> "Go to SO (stackoverflow.com) and ask. <grin>"

第二个参数,如果为true,则导致rel="nofollow"插入.第三个参数,如果为true,则转义在HTML中具有特殊含义的字符.请参阅自述文件.

7> Christian Ko..：

我将Roshambo String.linkify()更改为emailAddressPattern以识别aaa.bbb.@ ccc.ddd地址

if(!String.linkify) {
    String.prototype.linkify = function() {

        // http://, https://, ftp://
        var urlPattern = /\b(?:https?|ftp):\/\/[a-z0-9-+&@#\/%?=~_|!:,.;]*[a-z0-9-+&@#\/%=~_|]/gim;

        // www. sans http:// or https://
        var pseudoUrlPattern = /(^|[^\/])(www\.[\S]+(\b|$))/gim;

        // Email addresses *** here I've changed the expression ***
        var emailAddressPattern = /(([a-zA-Z0-9_\-\.]+)@[a-zA-Z_]+?(?:\.[a-zA-Z]{2,6}))+/gim;

        return this
            .replace(urlPattern, '$&')
            .replace(pseudoUrlPattern, '$1$2')
            .replace(emailAddressPattern, '$1');
    };
}

8> degenerate..：

我在谷歌搜索了更新的东西并遇到了这个:

$('p').each(function(){
   $(this).html( $(this).html().replace(/((http|https|ftp):\/\/[\w?=&.\/-;#~%-]+(?![\w\s?&.\/;#~%"=-]*>))/g, '$1 ') );
});

演示: http ://jsfiddle.net/kachibito/hEgvc/1/

适用于普通链接.

9> FlycKER..：

最好的脚本:http: //benalman.com/projects/javascript-linkify-process-lin/

10> rlemon..：

此解决方案与许多其他解决方案一样,并且实际上使用与其中一个相同的正则表达式,但是它不会返回HTML字符串,而是返回包含A元素和任何适用文本节点的文档片段.

 function make_link(string) {
    var words = string.split(' '),
        ret = document.createDocumentFragment();
    for (var i = 0, l = words.length; i < l; i++) {
        if (words[i].match(/[-a-zA-Z0-9@:%_\+.~#?&//=]{2,256}\.[a-z]{2,4}\b(\/[-a-zA-Z0-9@:%_\+.~#?&//=]*)?/gi)) {
            var elm = document.createElement('a');
            elm.href = words[i];
            elm.textContent = words[i];
            if (ret.childNodes.length > 0) {
                ret.lastChild.textContent += ' ';
            }
            ret.appendChild(elm);
        } else {
            if (ret.lastChild && ret.lastChild.nodeType === 3) {
                ret.lastChild.textContent += ' ' + words[i];
            } else {
                ret.appendChild(document.createTextNode(' ' + words[i]));
            }
        }
    }
    return ret;
}

有一些警告,即旧的IE和textContent支持.

这是一个演示.

@DanDascalescu可能会提供你所说的边缘案例,而不是全面覆盖.

所以有边缘情况.精彩.这些答案对其他人来说可能仍然有用,而且对它们进行贬低似乎有点矫枉过正.您评论过的其他答案和看似downvoted**确实**包含有用的信息(以及您的答案).不是每个人都会反对所说的案例,并不是每个人都想要使用图书馆.

推荐阅读

程序员
c ++函数指针没有改变

如何解决《c++函数指针没有改变》经验，为你挑选了0个好方法。 ... [详细]
程序员
只需使用Immutable.js将对象分配给变量,即可克隆新对象

如何解决《只需使用Immutable.js将对象分配给变量,即可克隆新对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何应对竞争条件

如何解决《如何应对竞争条件》经验，为你挑选了1个好方法。 ... [详细]
程序员
一个TickObject到底是什么？如何防止它成为内存泄漏？

如何解决《一个TickObject到底是什么？如何防止它成为内存泄漏？》经验，为你挑选了1个好方法。 ... [详细]
程序员
3-D笛卡尔指向2-D半球形并计算2-D Voronoi单元的面积

如何解决《3-D笛卡尔指向2-D半球形并计算2-DVoronoi单元的面积》经验，为你挑选了0个好方法。 ... [详细]
程序员
对象初始值设定项中的属性赋值与C#6中的自动属性不在同一级别上

如何解决《对象初始值设定项中的属性赋值与C#6中的自动属性不在同一级别上》经验，为你挑选了1个好方法。 ... [详细]
程序员
'List <T>'可能不包含'Object'类型的类型对象

如何解决《'List<T>'可能不包含'Object'类型的类型对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sequelize - 如何搜索多个列？

如何解决《Sequelize-如何搜索多个列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误的CSS风格

如何解决《错误的CSS风格》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Windows窗体创建.exe文件

如何解决《如何从Windows窗体创建.exe文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取pandas数据帧中所有唯一行的计数

如何解决《获取pandas数据帧中所有唯一行的计数》经验，为你挑选了1个好方法。 ... [详细]
程序员
文件扩展的正则表达式

如何解决《文件扩展的正则表达式》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法在PIL中指定矩形的宽度？

如何解决《有没有办法在PIL中指定矩形的宽度？》经验，为你挑选了2个好方法。 ... [详细]
程序员
什么是MVC 6中@ Scripts.Render的替代品

如何解决《什么是MVC6中@Scripts.Render的替代品》经验，为你挑选了1个好方法。 ... [详细]
程序员
虚拟继承的价格是多少？

如何解决《虚拟继承的价格是多少？》经验，为你挑选了1个好方法。 ... [详细]
程序员
CSS转换旋转仅在div向左浮动时才起作用

如何解决《CSS转换旋转仅在div向左浮动时才起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用UIAppearance更改所有UITableViewCell的文本颜色

如何解决《使用UIAppearance更改所有UITableViewCell的文本颜色》经验，为你挑选了0个好方法。 ... [详细]
程序员
根据JavaScript中的长度将字符串转换为一系列下划线

如何解决《根据JavaScript中的长度将字符串转换为一系列下划线》经验，为你挑选了1个好方法。 ... [详细]
程序员
Git Push to Rails Production给出响应你的Ruby版本是1.9.3,但你的Gemfile指定2.2.2当Ruby Version是2.2.2

如何解决《GitPushtoRailsProduction给出响应你的Ruby版本是1.9.3,但你的Gemfile指定2.2.2当RubyVersion是2.2.2》经验，为你挑选了0个好方法。 ... [详细]
程序员
我可以对两个不同的应用程序使用相同的Firebase吗？

如何解决《我可以对两个不同的应用程序使用相同的Firebase吗？》经验，为你挑选了1个好方法。 ... [详细]

放ch养奶牛

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章