visual
话题找到数量
modelscope/FunASR
端到端语音识别基础工具包与开源SOTA预训练模型,支持语音识别、语音活动检测、文本后处理等功能。
K-Dense-AI/claude-scientific-skills
一套开箱即用的智能体技能集,适用于研究、科学、工程、分析、金融与写作领域。
poloclub/transformer-explainer
视觉化解读 Transformer:通过交互式可视化学习 LLM Transformer 模型工作原理
ryanoasis/vim-devicons
为Vim插件添加文件类型图标,例如:NERDTree、vim-airline、CtrlP、unite、Denite、lightline、vim-startify 等诸多插件。
salesforce/BLIP
BLIP 模型的 PyTorch 实现:通过自举法实现语言-图像预训练,达成统一视觉-语言理解与生成