Camille 发表于 2018-11-11 22:22

易語言不規則文本去重

本帖最后由 Camille 于 2018-11-11 22:23 编辑


如图,打算批量去除这种不规则的重复文本,.目前的代码(非完整代码,考虑到拼接无法实现就没写去重了),取出前后文本后   打算用前面url批量对比删除


问题存在于删除后拼接成分割前的完整url,希望解答


论坛不允许上传txt,后面有需要再上传网盘吧

laoluo791 发表于 2018-11-11 22:22

Camille 发表于 2018-11-12 01:21
能否给一份例子,我的代码像我贴出来的那样取出来然后去掉重复以后,后面就不知道该怎么去操作了

重要的是思路呀 ! 把思路转换成代码就是你要做的事情呀 ! 有思路了编码就很简单了呀

laoluo791 发表于 2018-11-11 23:42

所以你到底想取出什么?id?麻烦列出原文本,然后展示处理之后的文本。

Camille 发表于 2018-11-12 00:09

laoluo791 发表于 2018-11-11 23:42
所以你到底想取出什么?id?麻烦列出原文本,然后展示处理之后的文本。

并不是想取出什麽,而是想去重複

laoluo791 发表于 2018-11-12 00:27

本帖最后由 laoluo791 于 2018-11-12 00:29 编辑

Camille 发表于 2018-11-12 00:09
并不是想取出什麽,而是想去重複
问号分割,后面都是参数,而且去重复也要知道你想到哪一种程度,是只保留唯一的id不同?还是留下key value

Camille 发表于 2018-11-12 00:42

laoluo791 发表于 2018-11-12 00:27
问号分割,后面都是参数,而且去重复也要知道你想到哪一种程度,是只保留唯一的id不同?还是留下key valu ...

图片内这种url只留下一条即可,但是需要注意的是需要保留原本的一切

laoluo791 发表于 2018-11-12 01:10

Camille 发表于 2018-11-12 00:42
图片内这种url只留下一条即可,但是需要注意的是需要保留原本的一切

这样太简单了吧,首先以/ 分割。
然后判断的,遍历已经保存的数据,看看在/分割之后,是不是有五处相同(自己设权),相同的话就是同一类,那么不保存,继续遍历。如果已保存的数据里面没有找到同类的,那么就保存进去

这样在处理完成之后,表里的每一条数据,都是和其他数据不同的。实现了同类数据,只取一条的功能。

如果你的数据都是不同的网站的话,你也可以以 ?号直接分割,比对前面就可以判断是不是同一个网站的了

Camille 发表于 2018-11-12 01:21

laoluo791 发表于 2018-11-12 01:10
这样太简单了吧,首先以/ 分割。
然后判断的,遍历已经保存的数据,看看在/分割之后,是不是有五处相 ...

能否给一份例子,我的代码像我贴出来的那样取出来然后去掉重复以后,后面就不知道该怎么去操作了

德玛西亚之帅 发表于 2018-11-12 11:20

看不懂怎么办

喝水 发表于 2018-11-12 12:04

有思路了编码就很简单了呀
页: [1]
查看完整版本: 易語言不規則文本去重