Project Icon

evo

实现跨尺度DNA序列建模与设计的开源工具

Evo是一个开源的生物基础模型,专注于DNA序列的长上下文建模和设计。基于StripedHyena架构,Evo实现了单核苷酸级别的序列建模,具有近乎线性的计算和内存扩展性。该模型拥有70亿参数,在OpenGenome数据集上训练,包含约3000亿个原核全基因组标记。Evo提供8K和131K上下文长度的预训练模型,适用于从分子到基因组尺度的序列分析和生成任务。研究人员可通过HuggingFace和Together API等多种方式使用Evo,为DNA序列研究提供了强大而灵活的工具。

Mol-Instructions - 大规模生物分子指令数据集助力大语言模型
GithubMol-Instructions大语言模型开源项目数据集生物分子蛋白质
Mol-Instructions是一个开放的大规模生物分子指令数据集,包含分子导向、蛋白质导向和生物分子文本三类指令。数据集涵盖分子设计、蛋白质功能预测等多个任务,通过AI协作、数据提取和模板转换等方法构建。该数据集旨在增强大语言模型在生物分子领域的表现,现已在Hugging Face平台发布。
enformer-pytorch - 基于深度学习的基因表达预测工具
DeepmindEnformerGithubHuggingfacePytorch基因表达预测开源项目
此项目实现了Deepmind的Enformer模型在Pytorch框架下的应用,用于预测基因表达,并支持微调预训练模型以适应下游任务。用户可以通过简易安装和提供的代码示例快速使用该模型。此外,该项目还包含染色质可及性预测的微调方法,并支持从Huggingface下载预训练权重。在内存优化和详细的安装、使用说明方面进行了多项改进,帮助用户高效地进行基因组数据分析和预测。
alphamissense - 全蛋白质组错义突变效应预测的革命性工具
AlphaMissenseGithub基因数据库开源项目模型实现氨基酸替换蛋白质序列
AlphaMissense是一个预测蛋白质错义变异效应的开源模型。该项目提供模型实现、数据处理流程和人类氨基酸替换的预计算结果。基于AlphaFold开发,AlphaMissense利用多个遗传数据库进行序列比对,为研究人员提供蛋白质变异影响分析。其预测结果可通过Ensembl VEP工具使用,支持蛋白质功能研究和相关疾病研究。
ugene - UGENE 跨平台开源生物信息学软件工具包
GithubQtUGENE开源项目生物信息学跨平台软件开发
UGENE是一个跨平台的生物信息学软件工具包,提供DNA序列分析、蛋白质结构预测和分子动力学模拟等功能。该项目基于Qt框架开发,支持Windows和*nix系统。UGENE的开源性质使研究人员和开发者能够根据特定需求进行构建和定制。项目要求Qt 5.12.0至5.15.x版本,并支持命令行和图形界面操作。
awesome-bioie - 免费工具和方法助力提取非结构化生物医学数据中的信息
BERTBioIEGithubLLMs开源项目生物医学数据自然语言处理
这个开源项目提供了一系列无需付费且许可要求低的资源,旨在从非结构化生物医学数据和文本中提取结构化信息。随着语言模型如BERT和GPT-4的引入,生物信息提取方法得到了显著优化。项目涵盖多个方面,包括研究概述、活跃群组、工具和数据集,所有资源均公开且积极维护。
EAGLE - 大型语言模型快速解码的新突破
EAGLEGithub大语言模型开源项目快速解码性能维持推理速度
EAGLE项目为大型语言模型提供了一种高效的快速解码方法。通过创新的特征外推技术,EAGLE显著提升了生成效率。其改进版EAGLE-2引入了动态草稿树结构,进一步优化了性能。与传统解码方法相比,EAGLE和EAGLE-2在13B模型上分别实现了3倍和4倍的速度提升。该开源项目不仅提供了多种预训练模型权重,还支持各类LLM架构,并配备了详尽的使用文档和评估工具。
Reinvent - 分子设计与优化的开源人工智能工具
GPUGithubPythonREINVENT分子设计开源项目机器学习
REINVENT 3.2是一个开源的分子设计与优化工具,结合深度学习和强化学习技术实现分子生成和优化。该基于Python的项目支持多种运行模式,使用JSON配置文件控制,并利用CUDA加速的GPU进行计算。REINVENT 3.2提供详细的安装指南、系统要求和使用教程,支持Jupyter notebook交互式使用,便于研究人员快速上手和实验。此外,项目还包含单元测试框架,可广泛应用于药物研发和材料设计等领域的分子设计任务。
Evolv AI - AI体验优化平台
AI优化AI工具实验数据驱动用户体验转化率
Evolv AI是一个AI驱动的体验优化平台,通过评估数字体验提供UX改进建议,自动化构建和优化用户体验。平台能生成实验所需代码、文案和图片,与现有技术无缝集成,持续优化多个客户接触点,提升转化率和收入等关键指标。该平台利用AI技术评估数字体验,支持数据驱动决策,实现个性化体验和实时优化,帮助企业提高关键业务指标。
AdaSeq - 完善的序列理解模型开发库,涵盖多种高级任务
AdaSeqGithubModelScopePyTorch命名实体识别序列理解开源项目
AdaSeq是由阿里巴巴达摩院开发的一体化序列理解工具库,构建在ModelScope之上。支持词性标注、分块、命名实体识别、实体类型化、关系抽取等多种任务。提供丰富的前沿模型和训练方法,优于许多现有框架。该库使用简便,只需一行命令即可生成模型,支持自定义模型和数据集。适用于研究人员和开发者,项目处于快速开发阶段,并提供多语言、多领域的数据集和在线演示。
evalscope - 综合性大语言模型评估开源工具
EvalScopeGithub可视化大语言模型开源项目模型集成评估框架
EvalScope是一个全面的大语言模型评估框架,集成了多种基准数据集和评估指标。该框架提供模型集成、自动评估和报告生成功能,并支持Arena模式和可视化分析。通过整合OpenCompass和VLMEvalKit评估后端,EvalScope实现了多模态评估能力。此外,它能与ModelScope SWIFT平台无缝对接,支持大模型的端到端开发流程。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号