项目介绍:hacker-news-digest
概述
hacker-news-digest 是一个利用人工智能技术生成新闻摘要的项目。这个项目的目标是通过从 Hacker News 文章中提取要点,提供一个流畅的新闻浏览体验。这些摘要主要通过 ChatGPT 的 gpt-3.5-turbo 模型生成,当 ChatGPT 不可用时,则使用本地的 GoogleT5 模型作为备用。
主要功能
- 清晰且易于理解的摘要:由先进的人工智能助手生成,使读者可以快速获取文章的核心内容。
- 相关插图:使文章既易于浏览又有视觉吸引力。
- 无缝嵌入:支持常见视频网站、PDF和GitHub gists。
- 灵活的文章排序和筛选:用户可以根据文章评分、评论数量或发布时间对文章进行排序。此外,还可以根据评分筛选出最热门的前N篇文章。
- RSS订阅支持:方便用户获取更新。
- 本地化翻译:支持中文翻译。
系统原理
hacker-news-digest 网站是一个静态网站,托管在 GitHub Pages 上。其运作机制包括以下几个定期动作:
- 解析Hacker News页面:获取新闻文章列表。
- 文章内容抽取:使用评分算法提取每篇新闻文章的主要内容。
- 插图搜索:为每篇文章寻找最合适的插图并制作本地副本。
- 摘要生成:使用 OpenAI 的API生成文章摘要,当API不可用时会调用本地模型。
- 模板渲染与部署:将生成的插图和摘要整合进模板,并将其部署到 GitHub Pages。
本地化
hacker-news-digest 使用 ChatGPT 进行翻译,目前支持中文翻译。
项目待办
- 寻找更优的网页抓取方式(可能使用 PhantomJS 和 Selenium)。
- 对文章评论进行摘要。
- 切换到使用 Hacker News API 进行数据获取。
- 设计更美观的主页。
- 探索替代的本地摘要生成模型。
- 已完成功能包括:按评分、评论、时间排序文章、根据评分筛选前N篇文章、RSS支持及在 GitHub pages 的部署。
此项目旨在通过先进的AI技术,提供一种快速高效的新闻获取方式,帮助用户在海量信息中掌握最重要的内容。