易語言不規則文本去重-吾爱汇编-防破解,反调试,反汇编,软件安全,逆向分析-52hb.com

Camille 发表于 2018-11-11 22:22

易語言不規則文本去重

本帖最后由 Camille 于 2018-11-11 22:23 编辑

如图,打算批量去除这种不规则的重复文本,.目前的代码(非完整代码,考虑到拼接无法实现就没写去重了),取出前后文本后打算用前面url批量对比删除

问题存在于删除后拼接成分割前的完整url,希望解答

论坛不允许上传txt,后面有需要再上传网盘吧

laoluo791 发表于 2018-11-11 22:22

Camille 发表于 2018-11-12 01:21
能否给一份例子,我的代码像我贴出来的那样取出来然后去掉重复以后,后面就不知道该怎么去操作了

重要的是思路呀！把思路转换成代码就是你要做的事情呀！有思路了编码就很简单了呀

laoluo791 发表于 2018-11-11 23:42

所以你到底想取出什么？id？麻烦列出原文本，然后展示处理之后的文本。

Camille 发表于 2018-11-12 00:09

laoluo791 发表于 2018-11-11 23:42
所以你到底想取出什么？id？麻烦列出原文本，然后展示处理之后的文本。

并不是想取出什麽,而是想去重複

laoluo791 发表于 2018-11-12 00:27

本帖最后由 laoluo791 于 2018-11-12 00:29 编辑

Camille 发表于 2018-11-12 00:09
并不是想取出什麽,而是想去重複
问号分割，后面都是参数，而且去重复也要知道你想到哪一种程度，是只保留唯一的id不同？还是留下key value

Camille 发表于 2018-11-12 00:42

laoluo791 发表于 2018-11-12 00:27
问号分割，后面都是参数，而且去重复也要知道你想到哪一种程度，是只保留唯一的id不同？还是留下key valu ...

图片内这种url只留下一条即可,但是需要注意的是需要保留原本的一切

laoluo791 发表于 2018-11-12 01:10

Camille 发表于 2018-11-12 00:42
图片内这种url只留下一条即可,但是需要注意的是需要保留原本的一切

这样太简单了吧，首先以/ 分割。
然后判断的，遍历已经保存的数据，看看在/分割之后，是不是有五处相同（自己设权），相同的话就是同一类，那么不保存，继续遍历。如果已保存的数据里面没有找到同类的，那么就保存进去

这样在处理完成之后，表里的每一条数据，都是和其他数据不同的。实现了同类数据，只取一条的功能。

如果你的数据都是不同的网站的话，你也可以以？号直接分割，比对前面就可以判断是不是同一个网站的了

Camille 发表于 2018-11-12 01:21

laoluo791 发表于 2018-11-12 01:10
这样太简单了吧，首先以/ 分割。
然后判断的，遍历已经保存的数据，看看在/分割之后，是不是有五处相 ...

能否给一份例子,我的代码像我贴出来的那样取出来然后去掉重复以后,后面就不知道该怎么去操作了

德玛西亚之帅 发表于 2018-11-12 11:20

看不懂怎么办

喝水发表于 2018-11-12 12:04

有思路了编码就很简单了呀

页: [1]

吾爱汇编's Archiver

易語言不規則文本去重