Transformer Explainer：文本生成模型交互式可视化工具

1. 文本生成模型的交互式可视化工具Transformer彻底改变了机器学习，但其内部工作原理对许多人来说仍然晦涩难懂。Transformer Explainer是一款交互式可视化学习工具，旨在帮助非专家通过GPT-2模型了解Transformer架构。该工具通过集成模型概述并实现数学运算和模型结构抽象级别的平滑过渡，帮助用户理解复杂的 Transformer 概念。它可以在Web浏览器中本地运行实时 GPT-2 实例，使用户能够尝试自己的输入并实时观察Transformer的内部组件和参数如何协同工作以预测下一个标记。该工具无需安装或特殊硬件，扩大了普通用户对现代生成式AI技术的教育渠道。

工具地址：https://poloclub.github.io/transformer-explainer/论文地址：https://huggingface.co/papers/2408.04619

2. 视频自动翻译成多语言并进行AI配音的工具

Linly-Dubbing 是一个智能视频多语言AI配音和翻译工具，它融合了YouDub-webui的灵感，并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择，通过集成Linly-Talker的数字人对口型技术，为用户带来更加自然的多语言视频体验。通过整合最新的AI技术，Linly-Dubbing 在多语言配音的自然性和准确性方面达到了新的高度，适用于国际教育、全球娱乐内容本地化等多种场景，帮助团队将优质内容传播到全球各地。

主要特点包括：

多语言支持: 支持中文及多种其他语言的配音和字幕翻译，满足国际化需求。
AI 智能语音识别: 使用先进的AI技术进行语音识别，提供精确的语音到文本转换和说话者识别。
大型语言模型翻译: 结合领先的本地化大型语言模型（如GPT），快速且准确地进行翻译，确保专业性和自然性。
AI 声音克隆: 利用尖端的声音克隆技术，生成与原视频配音高度相似的语音，保持情感和语调的连贯性。
数字人对口型技术: 通过对口型技术，使配音与视频画面高度契合，提升真实性和互动性。
灵活上传与翻译: 用户可以上传视频，自主选择翻译语言和标准，确保个性化和灵活性。
定期更新: 持续引入最新模型，保持配音和翻译的领先地位。

https://github.com/Kedreamix/Linly-Dubbing

3. 从零开始构建一个卷积神经网络

近期介绍CNN的最好动画教程之一，教程从原理到实践，帮助学习者理解神经网络每一层的核心原理，通过动画演绎卷积过程、解决问题与应用场景。

https://www.analyticsvidhya.com/blog/2021/08/a-hands-on-guide-to-build-your-first-convolutional-neural-network-model/

4. 开源远程桌面工具-RustDesk

RustDesk是一个用Rust编写的开源远程桌面工具，官方宣称它是TeamViewer的开源替代品，可以自主部署，支持点对点连接，隐私安全和全平台客户端。可以使用安卓手机远程控制Windows或Linux操作系统，操作比较流畅。

https://github.com/rustdesk/rustdesk

5. 麻省理工700页《决策算法》免费下载

麻省理工出品的这本《决策算法》详细讲解可以用于学习，工作生活决策场景的经典数学原理和概率算法，理解世界本质，帮助形成科学决策，内容包括序列问题，概率推理，模型/状态不确定性，多Agent系统等。

下载地址：https://algorithmsbook.com

6. 《李宏毅深度学习教程》免费下载

李宏毅老师的《机器学习》是深度学习领域经典的中文视频之一。李老师幽默风趣的授课风格深受大家喜爱，让晦涩难懂的深度学习理论变得轻松易懂，他会通过很多动漫相关的有趣例子来讲解深度学习理论。李老师的课程内容很全面，覆盖了到深度学习必须掌握的常见理论，能让学生对于深度学习的绝大多数领域都有一定了解，从而可以进一步选择想要深入的方向进行学习，培养深度学习的直觉，对于想入门深度学习又想看中文讲解的同学是非常推荐的。本教程主要内容源于《机器学习》（2021年春），并在其基础上进行了一定的原创。比如，为了尽可能地降低阅读门槛，笔者对这门公开课的精华内容进行选取并优化，对所涉及的公式都给出详细的推导过程，对较难理解的知识点进行了重点讲解和强化，以方便读者较为轻松地入门。此外，为了丰富内容，笔者在教程中选取了《机器学习》（2017年春）的部分内容，并补充了不少除这门公开课之外的深度学习相关知识。

https://github.com/datawhalechina/leedl-tutorial

7. 整合GraphRAG到Neo4j

将微软GraphRAG输出存储到Neo4j中，并使用LangChain或LlamaIndex实现本地和全局检索器。主要内容包括图谱构建、分析、数据清洗、图谱实体和关系分布分析、全局检索和智能问答的全流程实战教程，并基于LangChainAI实现了此流程并开源代码。

教程：https://neo4j.com/developer-blog/microsoft-graphrag-neo4j/

代码：https://github.com/tomasonjo/blogs/tree/master/msft\_graphrag

8. NASA发布TROPICS数据集

NASA的GESDISC发布了来自CubeSats 3、5、6、7 等卫星的最新的时间分辨降水结构和风暴强度观测数据。该任务使用 TROPICS 毫米波探测器 (TMS) 来观测热带气旋的热力学和结构特征。TMS 有12个通道，涵盖W波段、F波段（温度剖面）和G波段（湿度剖面）微波波段。此版本包括2023年 5月发射的四颗立方体卫星的两个临时数据产品成熟度版本（版本0.2）和两个经过验证的数据产品成熟度版本（版本 1.0）。

https://go.nasa.gov/4dLKbGt

9. 牛津大学发布世界首个用于自动研究和开放式发现的AI科学家

AI科学家实现了从构思、写代码、运行实验、总结结果、撰写整篇论文再到同行评审的端到端流程。

通用人工智能面临的一大挑战是开发能够进行科学研究和发现新知识的智能体。虽然前沿模型已经被用作人类科学家的助手，例如用于集思广益、编写代码或预测任务，但它们仍然只完成了科学过程的一小部分。论文提出了第一个全自动科学发现的综合框架，使前沿大型语言模型能够独立进行研究并传达其发现。作者介绍了AI科学家，它可以产生新颖的研究想法、编写代码、执行实验、可视化结果、通过撰写完整的科学论文描述其发现，然后运行模拟审查过程进行评估。原则上，这个过程可以重复进行，以开放式的方式迭代开发想法，就像人类科学家一样。作者通过将其应用于机器学习的三个不同子领域来展示它的多功能性：扩散建模、基于Transformer的语言建模和学习动力学。每个想法都以不到15美元的成本实施并开发成一篇完整的论文。为了评估生成的论文，作者设计并验证了一个自动审阅器，发现它在评估论文分数方面的表现接近人类。AI科学家可以制作出超过顶级机器学习会议接受门槛的论文，这些论文由自动审阅器评判。这种方法标志着机器学习科学发现新时代的开始：将人工智能代理的变革性优势带入人工智能本身的整个研究过程，并让我们更接近一个可以释放无尽的、负担得起的创造力和创新来解决世界上最具挑战性的问题的世界。论文地址：https://arxiv.org/abs/2408.06292

开源地址：https://github.com/SakanaAI/AI-Scientist

本公众号相关内容推荐：