awesome-low-light-image-enhancement

awesome-low-light-image-enhancement

低光图像增强资源汇总,数据集、技术方法与性能指标

本页面提供全面的低光图像增强资源,包含数据集、研究方法(如学习型方法和Retinex方法等)、重要论文及性能评估指标。涵盖ICCV、IEEE、ArXiv等期刊的最新研究,提供多种实用代码资源与社区讨论链接。此资源汇总适用于夜间监控、自动驾驶、荧光显微镜等领域,助力低光照图像处理的发展。

low light image enhancementICCV2023datasetsmethodsmetricsGithub开源项目

卓越的低光图像增强

这是一个低光图像增强的资源列表,包括数据集、方法/代码/论文、评估指标等。

期待您的分享!您可以在issue中提出您的想法和建议,或者直接提交pull request。

介绍

低光成像和低光图像增强在我们的日常生活和各种科学研究领域中有着广泛的应用,如夜间监控、自动驾驶、荧光显微镜、高速成像等。然而,考虑到低光子计数、低信噪比、复杂的噪声模型等巨大挑战,处理这些任务仍有很长的路要走。在此,我们收集了一份与低光图像增强相关的资源列表,包括数据集、方法/代码/论文、评估指标等。我们希望这能为新方法和解决方案的开发提供一些帮助。

目录

亮点

:high_brightness: <font color='red'> 新闻! </font>

  • 已更新ICCV2023的论文!

数据集

数据集简介网站
SID学习在黑暗中看见;<br />包含5094张原始短曝光图像,每张都有一个对应的长曝光参考图像(照明水平:户外场景0.2lux - 5lux;室内场景:0.03lux - 0.3lux)链接
ExDARK从极低光环境到黄昏(即10种不同条件)收集的7363张低光图像,包含12个物体类别(类似于PASCAL VOC),在图像类别级别和局部物体边界框上都进行了标注。github
LOL深度Retinex分解用于低光增强链接
SICE一个大规模的多曝光图像数据集,包含精心挑选的589个高分辨率多曝光序列,共4413张图像github
MIT-Adobe FiveK学习摄影全局色调调整;<br />由5000张照片组成的数据集,包含原始RAW图像和5位训练有素的摄影师进行调整的版本链接
DID具有多重曝光和摄像机的高质量低光视频数据集链接
DPED在移动设备上使用深度卷积网络拍摄的DSLR质量照片链接
VIP-LowLight在极低光条件下拍摄的八张自然图像链接
ReNOIRRENOIR - 真实低光图像噪声降低数据集链接
LLIV-Phone图像和视频由不同手机摄像头在各种光照条件和场景下拍摄链接
TM-DIED222张JPEG照片,构成一些最具挑战性的图像增强和色调映射算法案例链接
DRV202组配对的原始低光图像数据集链接
LIME少量未配对图像用于测试。链接
VV - Phos捕捉在不同光照条件下的15个场景的彩色图像数据库链接
500px数据集曝光:一个白盒照片后期处理框架-
扩展的耶鲁人脸数据库B扩展的耶鲁人脸数据库B包含28个人的16128张图像,在9个姿势和64种光照条件下。链接
夜间图像数据集一个包含能见度差的源图像及其通过不同图像增强算法处理后的图像的数据集链接
VE-LOL一个大规模低光图像数据集,服务于低/高层视觉任务,包含多样化的场景和内容,以及在真实场景中复杂的退化情况,被称为低光条件下的视觉增强(VE-LOL)。链接
SDSD在黑暗中看到动态场景:具有机电对准的高质量视频数据集github
MID在黑暗中匹配:低光场景图像对匹配数据集链接
DeepHDRVideoHDR视频重建:一个粗到细的网络和一个真实世界的基准数据集链接
LLVIPLLVIP:低光视觉用的可见-红外配对数据集链接
RELLISURRELLISUR:真实低光图像超分辨率数据集链接
LSRWR2RNet:基于真实低光到真实正常的网络进行低光图像增强;<br />使用Nikon摄像机拍摄的3170组配对图像和使用华为手机拍摄的2480组配对图像。github
MCR单色原始配对数据集;<br />一组由相同曝光设置捕捉的彩色原始图像和单色原始图像配对。每张图像的分辨率为1280x1024。共498个不同场景,每个场景都有1个对应的RGB和单色地面真值及8个不同曝光的彩色原始输入。谷歌驱动 百度网盘
原始图像低光物体数据集-链接
LRAICE基于学习排序的方法用于图像颜色增强-
LOM数据集一个在低光条件下用于NeRF的配对低光&过曝光&正常光多视角数据集谷歌驱动 百度网盘

评审和基准

年份出版论文链接备注
2021IJCV低光图像增强和超越的基准pdf
2021IEEE PAMI使用深度学习进行低光图像和视频增强:一项综述pdf
2022ArXiv低光图像和视频增强:一项全面综述和超越pdf 代码
2023ArXivDarkVision:用于低光图像/视频感知的基准pdfDarkVision
2023Signal Process.一项基于实验的全面综述,评估低光图像增强方法和低光图像质量pdf

方法

基于学习的方法

            | 年份 | 刊物 | 论文题目 | 链接 | 备注 |

| ---- | ----------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | -------------------- | | 2017 | ArXiv | MSR-net:Low-light Image Enhancement Using Deep Convolutional Network | pdf | MSR-net | | 2017 | ECCV | Deep Burst Denoising | pdf | | | 2017 | VCIP | LLCNN: A convolutional neural network for low-light image enhancement | pdf dataset | LLCNN | | 2017 | Pattern Recognit. | LLNet: A deep autoencoder approach to natural low-light image enhancement | pdf | LLNet | | 2017 | ACM Trans. Graph. | Deep bilateral learning for real-time image enhancement | pdf web code | HDRNet | | 2017 | ICCV | DSLR-Quality Photos on Mobile Devices with Deep Convolutional Networks | pdf | | | 2018 | BMVC | Deep Retinex Decomposition for Low-Light Enhancement | pdf web code | Retinex-Net | | 2018 | BMVC | MBLLEN: Low-light Image/Video Enhancement Using CNNs | pdf web code | MBLLEN | | 2018 | Pattern Recognit. Lett. | LightenNet: A Convolutional Neural Network for weakly illuminated image enhancement | pdf | LightenNet | | 2018 | CVPR | Learning to See in the Dark | pdf web code dataset | | | 2018 | IEEE TIP | Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images | pdf code | SICE | | 2018 | ACM TOG | Exposure: A White-Box Photo Post-Processing Framework | pdf code | | | 2018 | FG conference | GLADNet: Low-Light Enhancement Network with Global Awareness | pdf web code dataset | GLADNet | | 2019 | IEEE TIP | DeepISP: Towards Learning an End-to-End Image Processing Pipeline | pdf | DeepISP | | 2019 | IEEE TIP | Low-Light Image Enhancement via a Deep Hybrid Network | pdf | | | 2019 | IEEE TIP | EnlightenGAN: Deep Light Enhancement without Paired Supervision | code pdf | EnlightenGAN | | 2019 | ACM MM | Kindling the Darkness: A Practical Low-light Image Enhancer | pdf code code+ | KinD | | 2019 | IEEE Access | A Pipeline Neural Network for Low-Light Image Enhancement | pdf | | | 2019 | Neurocomputing | Learning Digital Camera Pipeline for Extreme Low-Light Imaging | pdf | | | 2019 | CVPR | Underexposed Photo Enhancement Using Deep Illumination Estimation | pdf code | DeepUPE | | 2019 | ICCV | Enhancing Low Light Videos by Exploring High Sensitivity Camera Noise | pdf | | | 2019 | ICIP | Enhancement of Weakly Illuminated Images by Deep Fusion Networks | pdf | | | 2019 | ICCP | A Bit Too Much? High Speed Imaging from Sparse Photon Counts | pdf | | | 2019 | ICIP | Llrnet: A Multiscale Subband Learning Approach for Low Light Image Restoration | pdf | Llrnet | | 2019 | ICIP | Low-Lightgan: Low-Light Enhancement Via Advanced Generative Adversarial Network With Task-Driven Training | pdf | Low-Lightgan | | 2019 | ICME | RDGAN: Retinex Decomposition Based Adversarial Learning for Low-Light Enhancement | code pdf | RDGAN | | 2019 | ICMEW | Low-Light Image Enhancement with Attention and Multi-level Feature Fusion | pdf | | | 2019 | PRCV | An Effective Network with ConvLSTM for Low-Light Image Enhancement | pdf | | | 2019 | VISIGRAPP | End-to-End Denoising of Dark Burst Images Using Recurrent Fully Convolutional Networks | pdf | | | 2020 | CVPR | Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement | pdf web code | Zero-DCE | | 2020 | CVPR | Learning to Restore Low-Light Images via Decomposition-and-Enhancement | pdf | | | 2020 | CVPR | From Fidelity to Perceptual Quality: A Semi-Supervised Approach for Low-Light Image Enhancement | pdf web slides | DRBN | | 2020 | CVPR | DeepLPF: Deep Local Parametric Filters for Image Enhancement | pdf code | DeepLPF | | 2020 | IEEE PAMI | Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time | pdf code | Image-Adaptive-3DLUT | | 2020 | IET Image Proc. | Learning an Adaptive Model for Extreme Low-Light Raw Image Processing | pdf code | | | 2020 | ArXiv | Visual Perception Model for Rapid and Adaptive Low-light Image Enhancement | pdf code | | | 2020 | ArXiv | Self-supervised Image Enhancement Network: Training with Low Light Images Only | pdf code | | | 2020 | ICPR | Unsupervised Real-world Low-light Image Enhancement with Decoupled Networks | pdf | | | 2021 | IJCV | Attention Guided Low-Light Image Enhancement with a Large Scale Low-Light Simulation Dataset | pdf code | | | 2021 | CVPR | Retinex-Inspired Unrolling with Cooperative Prior Architecture Search for Low-Light Image Enhancement | pdf web code | RUAS | | 2021 | CVPR | Deep Denoising of Flash and No-Flash Pairs for Photography in Low-Light Environments | pdf code | | | 2021 | CVPR | Extreme Low-Light Environment-Driven Image Denoising over Permanently Shadowed Lunar Regions with a Physical Noise Model | pdf | HORUS | | 2021 | CVPR | Learning Temporal Consistency for Low Light Video Enhancement from Single Images | pdf code | | | 2021 | CVPR | Nighttime Visibility Enhancement by Increasing the Dynamic Range and Suppression of Light Effects | pdf | | | 2021 | ICCV | Seeing Dynamic Scene in the Dark: A High-Quality Video Dataset with Mechatronic Alignment | pdf code | SDSD | | 2021 | ICCV | HDR Video Reconstruction: A Coarse-to-Fine Network and a Real-World Benchmark Dataset | pdf web code | DeepHDRVideo | | 2021 | ICCV | Matching in the Dark: A Dataset for Matching Image Pairs of Low-Light Scenes | pdf web code | MID |

<SOURCE_TEXT> | 2021 | ICCV | 低光图像增强的自适应展开全变差网络 | pdf code | UTVNet | | 2021 | ICCVW | LLVIP:用于低光视觉的可见光-红外成对数据集 | pdf code web | LLVIP | | 2021 | JVCIR | R2RNet:通过真实低光到真实正常网络进行低光图像增强 | pdf code | R2RNet | | 2022 | CVPR | 朝着快速、灵活和鲁棒的低光图像增强迈进 | pdf code | SCI | | 2022 | CVPR | 用于低光图像增强的深层色彩一致性网络 | pdf | DCC-Net | | 2022 | CVPR | URetinex-Net:基于Retinex的低光图像增强深度展开网络 | pdf code | URetinex-Net | | 2022 | CVPR | 用于夜间神经ISP训练的昼夜图像合成 | pdf code | | | 2022 | CVPR | 基于SNR的低光图像增强 | pdf code | | | 2022 | CVPR | 星光下的舞蹈:星光中视频去噪 | pdf | | | 2022 | CVPR | 放弃拜耳滤镜以在黑暗中观察 | pdf code | | | 2022 | ECCV | 无监督夜间图像增强:当层分解遇到光效抑制 | pdf code | | | 2022 | ECCV | 基于深度傅里叶的空间频率交互曝光校正网络 | pdf code | | | 2022 | ECCV | LEDNet:低光增强与去模糊联合网络 | pdf code | LEDNet | | 2022 | AAAI | 使用标准化流的低光图像增强 | pdf code web | LLFlow | | 2022 | AAAI | 用于低光图像增强的语义对比学习 | pdf code web | SCL-LLE | | 2022 | AAAI | DarkVisionNet:通过RGB-近红外融合与深度不一致先验实现低光成像 | pdf | DarkVisionNet | | 2022 | ACM MM | ChebyLighter:低光图像增强的最优曲线估计 | pdf code | ChebyLighter | | 2022 | BMCV | 只需90K参数就能适应光:用于图像增强和曝光校正的轻量级变换器 | pdf code | IAT | | 2022 | IJCV | 通过分解黑暗实现低光图像增强 | pdf code | Bread | | 2022 | Neurocomputing | 通过知识蒸馏进行低光图像增强 | pdf | | | 2022 | Neurocomputing | LSR:用于低光图像增强的点亮超分辨深度网络 | pdf | LSR | | 2022 | Pattern Recognit. | 类脑Retinex: 一种用于低光图像增强的生物可行Retinex算法 | pdf | | | 2022 | Pattern Recognit. | LAE-Net:用于低光图像增强的局部适应嵌入网络 | pdf | LAE-Net | | 2022 | Knowl-Based Syst | LE-GAN:使用注意力模块和身份不变损失的无监督低光图像增强网络 | pdf | LE-GAN | | 2022 | Opt. Lasers Eng. | 基于混合多尺度分解和自适应光调节的红外和低光可见光图像融合 | pdf | | | 2022 | Applied Soft Computing | 用于低光增强的预测智能方法 | pdf | | | 2022 | IEEE TMM | 通过近红外启发图像净化低光图像 | pdf | | | 2022 | IEEE TNNLS | DRLIE:通过解耦表示灵活低光图像增强 | pdf | | | 2022 | IEEE TCSVT | EFINet:通过增强融合迭代网络恢复低光图像 | pdf code | EFINet | | 2023 | Information Fusion | 用于高质量暗光视频摄影的相互增强双传感器计算摄影机 | pdf code | DCMAN | | 2023 | Pattern Recognit. | TreEnhance:一种用于低光图像增强的树搜索方法 | pdf code | TreEnhance | | 2023 | AAAI | 超高清低光图像增强:基准和基于变换器的方法 | pdf code web | | | 2023 | AAAI | 带有合成事件引导的低光视频增强 | pdf | | | 2023 | AAAI | 极化感知的低光图像增强 | pdf code | | | 2023 | CVPR | DNF:用于在黑暗中观察的解耦反馈网络 | pdf code | DNF | | 2023 | CVPR | 学习简单的低光图像增强器,以配对低光实例 | pdf code | PairLIE | | 2023 | CVPR | 学习用于低光图像增强的语义感知知识指导 | pdf code | SKF | | 2023 | CVPR | 通过结构建模和引导进行低光图像增强 | pdf | | | 2023 | CVPR | 用于极端低光摄影的物理引导ISO依赖传感器噪声建模 | pdf code | LLD | | 2023 | CVPR | 受限的宽带照明光谱设计,用于黑暗中观察 | pdf code| VCSD | | 2023 | IEEE TMM | 曙光:带有外部记忆的低光图像增强 | pdf code | EMNet | | 2023 | Mach. Vision Appl. | LDNet:结合照明和去噪的低光图像增强 | pdf | LDNet | | 2023 | IEEE TPAMI | 带有嵌套场景建模和协作架构搜索的低光视觉学习 | pdf code | RUAS | | 2023 | IEEE TIP | TSDN:黑暗中两阶段Raw去噪 | pdf | TSDN | | 2023 | IEEE TIP | 带有时空协同注意力变换器的无监督低光视频增强 | pdf | LightenFormer | | 2023 | IEEE TCYB| 用于曝光恢复的深度感知图像增强网络 | pdf | DPIENet | </SOURCE_TEXT> | 2023 | SIGGRAPH ASIA | 基于小波扩散模型的低光图像增强 | pdf code | DiffLL | | 2023 | ACM MM | CLE Diffusion: 可控光增强扩散模型 | pdf code web | CLE Diffusion | | 2023 | ACM MM | FourLLIE: 通过傅里叶频率信息提升低光图像增强 | pdf code | FourLLIE | | 2023 | Pattern Recognit. | 用于非均匀和低光图像增强的反射重加权Retinex模型 | pdf | | | 2023 | Pattern Recognit. | SurroundNet: 迈向有效的低光图像增强 | pdf code| SurroundNet | | 2023 | ICCV | 事件引导的低光视频增强 | pdf code web | EvLowLight | | 2023 | ICCV | 在黑暗中跳舞:迈向通用低光视频增强的基准测试 | pdf code | DID | | 2023 | ICCV | Diff-Retinex: 通过生成扩散模型重新思考低光图像增强 | pdf | Diff-Retinex | | 2023 | ICCV | 通过定制可学习先验增强低光图像增强器 | pdf code | CUE | | 2023 | ICCV | ExposureDiffusion: 学习曝光以进行低光图像增强 | pdf code | ExposureDiffusion | | 2023 | ICCV | 用于协同低光图像增强的隐式神经表示 | pdf code | NeRCo | | 2023 | ICCV | 基于光照感知伽玛校正和完整图像建模网络的低光图像增强 | pdf | COMO-ViT | | 2023 | ICCV | 基于多阶段残差量化和亮度感知注意力的低光图像增强 | pdf code | RQ-LLIE | | 2023 | ICCV | Retinexformer: 基于Retinex的一阶段transformer用于低光图像增强 | pdf code | Retinexformer | | 2023 | ICCV | 通过无监督分解和增强点亮NeRF | pdf code | LLNeRF | | 2023 | PRICAI | 高分辨率低光图像增强的Bootstrap扩散模型曲线估计 | pdf | BDCE | | 2024 | IEEE Sens. Lett. | 将图卷积整合到深层多层框架中用于低光图像增强 | pdf code | |

基于直方图均衡化的方法

年份出版社论文链接备注
1990IEEE TCE所有对比度限制自适应直方图均衡化:速度和效果pdfCLAHE
2007IEEE TCE保持亮度的动态直方图均衡化用于图像对比度增强pdf codeBPDHE
2007IEEE TCE一种用于图像对比度增强的动态直方图均衡化pdfDHE
2007IEEE TCE基于加权阈值直方图均衡化的快速图像/视频对比度增强pdfWTHE
2011IEEE TIP上下文和变分对比度增强pdfCVC
2013IEEE TIP基于2D直方图分层差表示的对比度增强pdf webLDR
2013ICASSP使用参数逼近的高效对比度增强pdfPOHE
  • 另请参阅: link

基于Retinex的方法

年份出版社论文链接备注
1997IEEE TIP中心/环绕Retinex的属性和性能pdfSSR
1997IEEE TIPBridging the gap between color images and the human observation of scenespdf code1 code2MSRCR
2013SITIS用于图像对比度增强的自适应多尺度Retinexcode pdfAMSR
2013IEEE TIP非均匀照明图像的自然保留增强算法pdf web codeNPE
2015IEEE TIP通过同时估计照明和反射来增强图像的概率方法pdf codeSRIE
2016CVPR一个用于同时估计反射和照明的加权变分模型pdf codeSRIE
2016Signal Processing一种用于弱光图像增强的基于融合的方法pdf codeMF
2016ACM MMLIME: 低照度图像增强方法pdf web codeLIME
2017IEEE TIPLIME: 通过照明图估计实现的低光图像增强pdf code1 code2 code3LIME
2017ICCVRetinex的联合内在-外在先验模型pdf web codeJieP
2018IEEE TIP通过鲁棒Retinex模型进行结构揭示的低光图像增强pdf code1 code2
2018Symmetry一种智能系统,用于在复杂光环境中通过保持颜色一致性和细节操作进行低亮度图像增强pdf
2019Symmetry用于低光图像增强的分数阶融合模型pdf
2019ICIP使用亮通道先验的单低光图像增强的混合L2-LP变分模型pdf
2019IET Image Proc.基于非均匀照明先验模型的低光图像增强pdfNIPM
2019Comput. Graphics Forum具有双重照明估计的鲁棒曝光校正pdf code
2020ic-ETITE基于照明估计算法的图像增强技术的比较分析pdf
2020IEEE TIPLR3M: 通过低秩正则化Retinex模型进行鲁棒的低光增强pdfLR3M
2023Vis Comput自然保持低光图像增强的照明估计pdfNPLIE
2023ICCVDiff-Retinex:使用生成性扩散模型重新思考低光图像增强pdfDiff-Retinex
2023ICCVRetinexformer:一种用于低光图像增强的单阶段Retinex变形器pdf codeRetinexformer

其他方法

年份出版社论文链接备注
2008IET Image Proc.快速中心-环绕对比度修改pdf
2011ICME用于增强低光视频的快速高效算法pdf code
2017ICCVW使用相机响应模型的新低光图像增强算法pdf code
2017ArXiv一种生物启发的多曝光融合框架用于低亮度图像增强pdf codeBIMEF
2017ICCAIP使用曝光融合框架的新图像对比度增强算法pdf web code1 code2
2019IEEE TIP通过光吸收散射模型进行低光图像增强pdfALSM
2019ICIP基于最大和导向滤波的快速图像增强pdf

相关作品

<SOURCE_TEXT>

年份出版论文链接备注标签
2012IST通过局部对比度增强改善特征检测的鲁棒性数据集
2015ACM ToG使用深度神经网络的自动照片调整网页 代码 pdf
2018CVPR扭曲与恢复:使用深度强化学习进行颜色增强代码 pdf
2021TMM低光脸部检测的循环曝光生成pdf 代码REGDet脸部检测
2021CVPRHLA-Face:用于低光脸部检测的联合高低适应网页 pdf 代码HLA-Face脸部检测
2021ICCV在黑暗物体检测中的具有正交切线正则性的多任务AETpdf 代码MAET物体检测
2021ICCVPhoton-Net:使用单光子相机进行光子缺乏场景推断pdf 代码 视频Photon-Net单光子
2021ICCVW极低光条件下的单阶段脸部检测pdf脸部检测
2021ICCVWDeLiEve-Net:使用光条和局部事件对低光图像去模糊pdfDeLiEve-Net事件相机
2022ArXiv一个高效的低光恢复变压器用于黑暗光场图像LRT光场
2022ICCP噪声模糊双重腐败下的稳健场景推断pdf 代码 网页噪声模糊双重物体检测
2023ICCVFeatEnHancer:在低光视觉下增强层次特征的物体检测及其他pdf 代码 网页FeatEnHancer物体检测和语义分割
2023IEEE TIPINFWIDE:用于低光条件下非盲图像去模糊的图像和特征空间维纳去卷积网络pdf 代码INFWIDE去模糊
2024AAAIAleth-NeRF:具有隐藏场假设的光照自适应NeRFpdf 代码 网页Aleth-NeRFNeRF

指标

指标缩写参考类型链接
峰值信噪比PSNR参考-
结构相似度指数测量SSIM参考-
学习感知图像补丁相似度LPIPS参考代码
亮度顺序误差LOE非参考论文
自然图像质量评价NIQE非参考论文
均方误差MSE参考-
平均绝对误差MAE参考-
智能手机摄影属性和质量SPAQ非参考代码
神经图像评估NIMA非参考pytorch tensorflow
多尺度图像质量变压器MUSIQ非参考代码

参考

编辑推荐精选

AEE

AEE

AI Excel全自动制表工具

AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。

UI-TARS-desktop

UI-TARS-desktop

基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。

UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。

Wan2.1

Wan2.1

开源且先进的大规模视频生成模型项目

Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。

爱图表

爱图表

全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表

爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。

Qwen2.5-VL

Qwen2.5-VL

一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

HunyuanVideo

HunyuanVideo

HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

WebUI for Browser Use

WebUI for Browser Use

一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

xiaozhi-esp32

xiaozhi-esp32

基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

olmocr

olmocr

一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

飞书多维表格

飞书多维表格

飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

下拉加载更多