StarWhisper

语言、时序与多模态框架

StarWhisper项目由国家天文台人工智能工作组支持，涵盖语言模型、时序模型和多模态模型。通过改进训练方法，该项目提升了天文物理、代码与Agent能力，并发布了基于大模型的光变曲线数据处理方法。项目还实现了多模态多任务框架与望远镜控制系统的对接，探索了多模态在天文学领域的应用可能。

Github

论文

介绍相关项目

whisper-large-v3-french-distil-dec8 - 优化法语语音识别的内存使用和推理效率

GithubHuggingfaceWhisper-Large-V3-French-Distil-Dec8开源项目推理速度模型法语自动语音识别语音转录

Whisper-Large-V3-French-Distil通过减少解码层数和优化推理时间，实现法语语音识别的高效性。该模型支持多种库，如transformers和openai-whisper，并能与原版Whisper-Large-V3-French模型结合使用，增强推理速度和结果一致性。评估数据表明其在多语料库中将单词错误率（WER）降至较低水平。

faster-whisper-small - 多语言语音识别的高效CTranslate2模型转换

CTranslate2GithubHuggingfaceOpenAIWhisper small开源项目模型模型转换音频识别

faster-whisper-small项目将openai的whisper-small模型转换为CTranslate2格式，支持多语言自动语音识别，采纳FP16精度以优化性能。此模型可用于CTranslate2基础项目，如faster-whisper，为开发者提供高效的语音转录方案。

whisper-standalone-win - OpenAI 的 Whisper 和 Faster-Whisper 的独立可执行文件

Faster-WhisperGithubOpenAI's Whisper可执行文件命令行开源项目语音转录

提供简易的独立执行程序，免安装Python，支持多系统。通过命令行轻松进行视频文件转录与翻译，有效整合与批量处理，满足多样的语音识别需求。资源占用低，效率优化。

openai-whisper - Next.js实现的自动语音识别，支持实时转录和录音回放

GithubNext.jsopenai-whisper实时转录开源项目自动化转录语音识别

本项目是基于OpenAI Whisper的自动语音识别系统webapp，使用Next.js框架开发。它能自动录音并上传至服务器进行转录和翻译，然后将结果返回前端。支持录音回放以验证输出效果，同时可通过设置消除背景噪音和调整录音暂停时间。项目仍在开发中，提供多种配置选项，适合需要快速实现语音转录功能的开发者。

SenseVoice - 高效、多语种语音识别与情绪识别技术平台

GithubSenseVoice多语言语音识别开源项目情绪识别推理效率热门音频事件检测

SenseVoice是一款支持多语言的语音解析模型，整合了自动语音识别、语种识别、情绪识别及音频事件检测功能。该项目采用非自回归端到端框架，可在超过50种语言上提供精准的语音识别服务，大幅降低了推理延迟，提供方便的微调脚本和多语种细粒度情绪分析，支持多种客户端语言和服务部署，适用于多种商业场景。

ASTRA.ai - 改进语音互动和自定义功能的高效代理方案

AstraDockerGithubGraph DesignerTENVoice agent开源项目

ASTRA.ai 由 TEN 驱动，提供无缝的对话体验。通过集成 Agora 和 Azure API，实现语音到文字及文字到语音的转换。使用 Docker 和 Node.js，本地构建和配置变得简单。开发者能够创建和自定义语音代理，零编码知识的用户也可通过 TEN 图形设计工具设计个性化代理应用。加入社区，分享应用和反馈，推动平台进步。更多详情请参见文档和贡献指南。

starchat2-15b-v0.1 - 基于StarCoder2微调的双能力开源语言模型

GithubHuggingfaceStarChat2人工智能代码生成大模型开源项目模型语言模型

StarChat2-15b-v0.1是一款基于StarCoder2的开源语言模型，拥有160亿参数规模。该模型通过合成数据集微调，在MT Bench、IFEval聊天评测及HumanEval代码测试中展现了均衡性能。模型支持600多种编程语言，具备代码生成和对话交互功能。开发者可通过Transformers框架调用，需注意模型存在输出偏差等局限性。

AstrBot - 综合支持QQ、Telegram与WeChat的多平台智能对话机器人

AstrBotGithub多平台消息处理大模型支持开源项目插件机器人

AstrBot是一个功能强大的多平台智能对话机器人，支持QQ群、QQ频道、Telegram和WeChat等通信平台。集成了OpenAI GPT、Claude、HuggingChat等先进大模型，提供丰富插件支持和可视化仪表盘，实现跨平台消息处理与个性化对话体验。适用于各种语境下的文本交互与任务执行，有效提升交流效率和互动质量。

YAYI - 多任务中文预训练模型，增强对话和分析功能

Github人工智能多轮对话开源开源项目指令微调雅意大模型

雅意大模型通过深度微调媒体宣传、舆情分析、公共安全等领域数据，提升了中文对话和领域分析能力。开源项目促进了中文预训练大模型社区的发展，支持全参数和LoRA微调，提供多轮对话和插件功能。基于高质量数据集训练，适用于中文多领域任务，具备优异的自然语言处理性能，持续优化安全性和拒识能力。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com