给Hacking8信息流增加了pdf全文搜索

admin 2023年1月20日08:13:45评论22 views字数 743阅读2分28秒阅读模式

很早就有这个想法了,看到很多技术文档和一些安全大会的内容是pdf形式放出的,于是也想让hacking8支持pdf全文索引。

正好最近换服务器,写了几天bug,把这个功能加上了,索引了珍藏的20G PDF (包含各种安全大会的pdf和一些技术文档资料)。 为此,特意把hacking8的搜索框放大了,方便搜索 。

给Hacking8信息流增加了pdf全文搜索

全文搜索语法

hacking8使用ES构建全文搜索,ES支持的语法都能使用,能像搜索引擎一样搜索内容

如普通的 “安全开发 面试”

给Hacking8信息流增加了pdf全文搜索

支持按节点搜索 node:

给Hacking8信息流增加了pdf全文搜索

节点的名称可以先进入「全部节点」,在里面点击找到节点名称

给Hacking8信息流增加了pdf全文搜索

常见的还有 || && ()  排除使用 -

如搜索“安全开发”的时候,有很多v2ex的节点

给Hacking8信息流增加了pdf全文搜索

此时可以使用 安全开发 -node:v2ex来排除v2ex节点。

「排序」

全文排序规则默认是按照搜索相关程度打分排序,相同时则按照时间倒序排序。

如果想看某个关键词最新的内容,可以使用 order by time desc手动设定按照时间倒序,order by time asc时间正序

按照分数倒序分数正序:order by score desc order by score asc

如想看到最新的安全招聘信息,可以输入安全 招聘 order by time desc 查看

给Hacking8信息流增加了pdf全文搜索

最后

  • Hacking8安全信息流是「免费的」,有想索引的pdf可以发邮件到[email protected]

  • Hacking8的 全文索引不是实时的,一般会在次日定时检索前一天的内容

  • hacking8安全信息流已经运行了两年多了,索引了不少数据,后面可以统计下各种词频,做一做"大数据分析”

  • 搜索引擎搜索“Hacking8安全信息流” 即可访问,就不放链接了


原文始发于微信公众号(Hacking就是好玩):给Hacking8信息流增加了pdf全文搜索

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年1月20日08:13:45
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   给Hacking8信息流增加了pdf全文搜索http://cn-sec.com/archives/1411041.html

发表评论

匿名网友 填写信息