• 一周万星的文本转语音开源项目「GitHub 热点速览」


    上周的热门开源项目让我想起了「图灵测试」,测试者在不知道对面是机器还是人类的前提下随意提问,最后根据对方回复的内容,判断与他们交谈的是人还是计算机。如果无法分辨出回答者是机器还是人类,则说明机器已通过测试,具有人类的智力水平。

    ​虽然现在大模型的回答还充满 AI “味”,可以一眼识破,但 GitHub 上有个开源项目:ChatTTS,它根据文本生成的语音,已经可以做到“以假乱真”,不单单是我这么觉得,一周飙升了 1w+ Star,已经足以说明大家对它的认可。

    作者为了限制 ChatTTS 生成的语音,在 4 万小时模型的训练过程中添加了少量额外的高频噪音,并尽可能压缩了音质,让其更好分辨出来,从而防止不法分子用它进行诈骗等违法行为,看来生成效果已经好到作者自己都“害怕”的地步了😅

    还有位开发者(lihaoyun6)因为看不惯 macOS 的录屏软件收费,就自己动手做了一个轻巧的 macOS 屏幕录制工具:QuickRecorder,它不仅功能齐全还免费开源。如果你觉得自己桌面有点单调,这有个小工具(RunCat_for_windows)可以在任务栏上显示一只奔跑的小猫,它会陪着你一起加班或写代码。文生图的效果很看提示词的质量,Omost 让你仅需一条极简的描述就能生成一张细节满满的图片,比如“一个有趣的卡通蝙蝠侠与小丑战斗”。

    最后,推荐一个用当下最新的前端技术栈构建的管理后台模版:soybean-admin 和一个非常漂亮的终端文件管理器:superfile

    • 本文目录
      • 1. 开源新闻
        • 1.1 强大的对话式文本转语音模型:ChatTTS
      • 2. 开源热搜项目
        • 2.1 直接使用 ChatTTS 的 WebUI:ChatTTS-ui
        • 2.2 轻巧的 macOS 屏幕录制工具:QuickRecorder
        • 2.3 开源的在线办公套件:Univer
        • 2.4 清新优雅的管理后台模板:soybean-admin
        • 2.5 极简提示词的文生图工具:Omost
      • 3. HelloGitHub 热评
        • 3.1 在 Windows 任务栏飞奔的“小猫”:RunCat_for_windows
        • 3.2 非常漂亮的终端文件管理器:superfile
      • 4. 结尾

    1. 开源新闻

    1.1 强大的对话式文本转语音模型:ChatTTS

    该项目是专门为对话场景设计的文本转语音模型,支持中、英双语。它不仅能够生成自然、流畅的语音,还能控制和添加笑声、停顿和语气词等。ChatTTS 生成较短的语音效果很好,几乎听不出 AI “味”。

    import ChatTTS
    from IPython.display import Audio
    
    chat = ChatTTS.Chat()
    chat.load_models(compile=False) # 设置为True以获得更快速度
    
    texts = ["在这里输入你的文本",]
    
    wavs = chat.infer(texts, use_decoder=True)
    
    torchaudio.save("output1.wav", torch.from_numpy(wavs[0]), 24000)
    

    GitHub 地址→github.com/2noise/ChatTTS

    2. 开源热搜项目

    2.1 直接使用 ChatTTS 的 WebUI:ChatTTS-ui

    主语言:PythonStar:2.1k周增长:2k

    该项目为 ChatTTS 提供了开箱即用的本地网页界面,可以直接在本地浏览器中使用 ChatTTS,支持文字合成语音、中英文、数字混杂等功能,并提供了 API 接口。

    GitHub 地址→github.com/jianchang512/ChatTTS-ui

    2.2 轻巧的 macOS 屏幕录制工具:QuickRecorder

    主语言:SwiftStar:2.6k周增长:500

    这是一个用 SWiftUI 编写、仅 10MB 的 macOS 屏幕录制工具,它只为做好录屏这一件事,不仅免费且功能丰富,支持窗口录制、应用录制、录制移动设备、窗口声音内录、鼠标高亮、隐藏桌面文件等功能。

    GitHub 地址→github.com/lihaoyun6/QuickRecorder

    2.3 开源的在线办公套件:Univer

    主语言:TypeScriptStar:5.1k周增长:1k

    这是一个功能丰富、易于集成的在线办公套件,它提供了类似 Google 文档、幻灯片(开发中)和表格的功能,支持富文本、表格公式、数据验证、国际化等功能。

    GitHub 地址→github.com/dream-num/univer

    2.4 清新优雅的管理后台模板:soybean-admin

    主语言:TypeScriptStar:8.3k周增长:300

    该项目是采用 Vu3、Vite5、Pinia 和 UnoCSS 等技术栈构建的管理后台模板,它不仅拥有漂亮的界面,还有清晰的项目结构、严格的类型检查、统一的代码规范,内置丰富的主题配置、国际化方案、页面组件,并且支持移动端。

    GitHub 地址→github.com/soybeanjs/soybean-admin

    2.5 极简提示词的文生图工具:Omost

    主语言:PythonStar:2.6k周增长:2k

    该项目基于 LLM 的编程能力帮用户自动完善文生图的提示词,可以根据用户输入的简短提示词生成高质量的图片,还支持图片局部修改等功能,比如将图片中的龙变成恐龙,极大地降低了编写文生图的门槛,无需复杂的提示词即可生成满意的图片。

    GitHub 地址→github.com/lllyasviel/Omost

    3. HelloGitHub 热评

    在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

    3.1 在 Windows 任务栏飞奔的“小猫”:RunCat_for_windows

    主语言:C#

    这是一个用 C# 写的小工具,它会在 Windows 任务栏显示一只奔跑的小猫动画,CPU 使用率越高它跑得越快。

    项目详情→hellogithub.com/repository/7c37c2e3bf3142e7bf5891f5070e3606

    3.2 非常漂亮的终端文件管理器:superfile

    主语言:Go

    这是一个现代终端文件管理器,为命令行文件操作提供了一个直观且漂亮的界面。它默认采用 Vim 风格的快捷键操作,还支持插件和主题自定义。

    项目详情→hellogithub.com/repository/d791057ece4f4662be25202c21405a27

    4. 结尾

    以上就是本期「GitHub 热点速览」的全部内容,希望你能够在这里找到自己感兴趣的开源项目,如果你有其他好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流和讨论。

    往期回顾

  • 相关阅读:
    [极客大挑战 2019]BabySQL
    低代码技术这么香,如何把它的开发特点发挥到极致?
    【Mysql专题】视图介绍及其基本操作
    用DIV+CSS技术设计的公益主题网站——防止电信诈骗(web前端网页制作课作业)
    【LeetCode-简单题】225. 用队列实现栈
    分布式数据服务总结v1.0
    【MEIF:ℓ1-ℓ0混合分解】
    LeetCode 面试题 05.06. 整数转换
    Flask 入门教程
    水表数字识别5:Android实现水表数字识别(含源码 可实时检测)
  • 原文地址:https://www.cnblogs.com/xueweihan/p/18230060