AI新工具

blog-thum
Fashion-VDM

Fashion-VDM是一种视频扩散模型,用于生成高质量的虚拟试穿视频,保持人物特征和动态一致性。

read more
blog-thum
VideoCaptioner

VideoCaptioner(卡卡字幕助手)是一款基于大语言模型的智能视频字幕处理软件,支持全流程字幕生成与优化。

read more
blog-thum
RMBG v2.0

RMBG v2.0是一个先进的图像背景去除模型,适用于多种商业场景。

read more
blog-thum
Lingma SWE-GPT

Lingma SWE-GPT是一个开源大语言模型,专注于软件工程领域的智能辅助和改进任务。

read more
blog-thum
Llama OCR

Llama OCR 是一款npm库,利用Llama 3.2 Vision进行免费OCR图像识别处理。

read more