魔音工坊是一款专业的AI配音工具,拥有800多款声音和1000多种风格,满足从视频配音到有声书的广泛需求。魔音工坊提供丰富的功能,包括语速调整、多音字选择、停顿控制等,确保文字转语音的效果逼真自然。用户可以轻松下载无损音频文件,享受便捷的配音体验。
讯飞智作是科大讯飞推出的一站式AIGC内容创作平台,基于人工智能技术提供文字转语音、虚拟数字人视频制作等服务。用户可以轻松实现音视频内容的快速生成,无需专业技能即可创作出高质量的媒体作品。
逗哥配音是广州有码科技推出的一站式AI配音工具,被誉为"抖音爆款配音始发地"。逗哥配音支持智能配音、声音克隆、文案提取、字幕生成、人声分离、视频去水印等,覆盖从文案到成片的完整创作流程。
讯飞译制是科大讯飞推出的AI音视频本地化平台,专注于视频字幕制作、多语种翻译与智能配音服务。基于科大讯飞在语音识别、机器翻译和语音合成领域的核心技术,可将传统"周级"的译制周期压缩至"小时级",语音转写准确率达97.5%,1小时音视频最快5-10分钟即可生成字幕。
Suno是一个专业高质量的AI歌曲和音乐创作平台,用户只需输入简单的文本提示词,即可根据流派风格和歌词生成带有人声的歌曲。该AI音乐生成器由来自Meta、TikTok、Kensho等知名科技公司的团队成员开发,目标是不需要任何乐器工具,让所有人都可以创造美妙的音乐。近期,Suno AI还与微软合作,支持直接通过微软的Copilot调用其插件生成音乐。
海绵音乐是字节跳动公司推出的AI音乐创作平台,基于AI技术生成个性化音乐,海绵音乐在中文歌曲创作上表现出色,提供灵感创作和自定义创作选项,支持一键生成歌词和旋律。
ElevenLabs 是AI文字转语音平台,为开发者、创作者和企业提供逼真的语音合成解决方案。核心产品包括文本转语音(支持包括中文在内的 29+ 语言、10,000+ 声音)、AI 配音、语音克隆、音乐生成等功能。
琅琅配音是一款智能文本转语音工具,提供语音合成服务。支持中文、英语、德语、法语等30多种语言,以及高兴、悲伤、兴奋等10多种情感风格。平台功能丰富,操作简单,支持SSML标签,实现多音字、多人配音等高级功能。
千音漫语是北京熠声科技推出的智能声音创作助手,为用户提供高效、便捷的声音创作解决方案。拥有1200+AI主播,支持全球多种语言,覆盖聊天对话、有声书、广告等多种场景。用户可以基于强大的智能配音功能,通过多音字、停顿、重读等近20个调音工具,打造自然流畅的配音效果。
MiniMax Audio是MiniMax推出的AI语音合成工具,能创建逼真的多语言、多声音和多情感的语音。支持文本转语音(TTS),能将文本快速转换为自然流畅的语音。用户只需提供30秒的音频素材,可将特定人的声音克隆,支持12种语言,包括中文、粤语、英语等。
Noiz AI 是 AI 语音克隆与合成工具,专注于为用户提供高效、个性化的语音解决方案。基于自研的超大语音模型,能在3-10秒内通过简短录音克隆出与真人无异的声音模型,广泛应用于文本生成语音(TTS)、视频配音和多语言视频翻译等场景。
Tunee 是天谱乐团队推出的首个对话式音乐创作Agent。以自然语言交互为核心,用户只需描述音乐需求,如风格、情绪、主题,可生成完整歌曲,包括作词、作曲、编曲及人声演唱。能理解用户模糊需求,生成主歌、副歌结构完整,情感丰富的歌曲,支持多种风格(流行、摇滚、国风等)。
讯飞听见是科大讯飞公司开发的一款语音转文字服务,它通过先进的语音识别技术,能够将语音实时准确地转换成文字。
NotebookLM 是谷歌推出的 AI 笔记应用,基于大型语言模型(LLM)帮助用户管理和吸收信息。用户可以上传文档、链接和文本,NotebookLM 能理解内容并生成摘要、回答提问,提出创造性想法。
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。
Vemus未音是腾讯音乐旗下首款一站式AI音乐创作工具,零门槛多模态音乐创作,人人都能玩音乐。把“写歌”压缩成三步:输入一句话、一张图或一段哼唱,AI在几秒内自动完成作词、作曲、编曲、演唱,支持流行、国风、电子等任意风格秒切换。
Nafy AI 是在线 AI 音乐生成器,主打广播级、免版税,支持从一句话到成品的端到端创作,也能对已有歌曲进行扩展、替换或翻唱。输入描述或歌词可生成带人声、伴奏的成品,自动母带处理,可直接商用。可续写桥段、延长尾奏、插入间奏,新段落与原曲情绪、节奏保持一致。
轻析 LiteSight 是 AI 视频内容提取工具,支持抖音、B站、快手、小红书等主流短视频平台链接解析。用户只需粘贴视频链接,AI 可自动完成转录、提炼、结构化,输出纯净文案、结构化大纲和思维导图,全程无需人工干预。
TurboScribe是强大的AI音视频转文字工具,专为高效处理音频和视频文件设计。采用先进的Whisper技术,能以高达99.8%的准确率将语音内容快速转换为文本,支持超过98种语言,提供翻译功能。
多维视界是一站式AI音视频智能分析平台,将非结构化的音视频内容转化为结构化的知识资产。支持本地音视频文件上传和主流音视频网站(如B站、抖音、小红书等)的链接分析。
天谱乐是趣丸科技唱鸭团队推出的全球首个多模态音乐生成大模型,支持文本、图片和视频等多种输入方式生成音乐。用户可以通过上传文本、图片或视频,生成最长3.5分钟的歌曲或音乐视频。能理解音乐的和弦、旋律、歌词、演唱风格等复杂特征,生成高契合度的视频配乐。
音疯是昆仑万维推出的AI音乐创作平台,基于人工智能技术简化音乐创作流程。用户只需输入歌词,即可一键生成原创歌曲,或通过提供参考音乐来创作风格相似的作品。平台支持多种音乐风格,提供创作灵感,并且支持创作者将作品上架销售,获得收益。
Mureka是昆仑万维推出的 AI 音乐商用创作平台,让专业艺术家和音乐爱好者能在平台上创作个性化音乐。用户在Mureka页面输入歌词,添加参考音乐,用Style功能控制音乐风格,创作出具有稳定性和可控性的AI音乐。
音潮是全栈自研的AI音乐创作平台,用音乐传递美好瞬间。通过强大的AI技术,支持文本、图片、哼唱等多种输入方式,能快速将用户的灵感转化为高品质的音乐作品。
音剪是喜马拉雅推出的一站式AI音频创作平台,提供多情感多模态的AI辅助工具,强大的在线剪辑能力,辅助用户轻松创作出优秀的音频作品。音剪集合了多项AI音频创作功能,包括AI音频剪辑、AI配乐、文章转语音、AI小说、音频转文字、AI分段、智能检测以及一键成片等。
音秘是百度推出的AI播客创作工具,让用户轻松创作个性化播客内容。音秘以“让创作更聪明,让声音更动人”为理念,结合UGC和PGC模式,降低播客制作门槛,赋能创作者。
MemoAI是免费的AI语音转文字工具,支持YouTube、播客及本地音视频文件转文本。MemoAI具备多语言转录、翻译、语音合成、说话人分离、实时字幕等功能。支持NVIDIA和AMD GPU加速,快速处理媒体文件。提供浮动笔记、剪辑分割、AI摘要和多种导出选项。MemoAI注重隐私,完全离线工作,跨平台支持Windows和macOS。
Reecho睿声是一个超拟真瞬时AI语音克隆平台,利用先进的AI语音技术,允许用户通过上传或录制一段音频样本,来创建并克隆特定的声音角色。该平台的特点是能够快速地从较短的音频样本中克隆声音,而不需要长时间的训练过程
Udio是一款由前Google DeepMind研究人员创立的人工智能音乐生成器,旨在让任何人都能够轻松地创作出具有情感共鸣的音乐。该AI音乐生成工具能够根据用户输入的文本提示,包括音乐风格、主题、歌词等信息,快速生成包含人声的完整音轨。
网易天音是网易推出的一站式AI音乐创作工具,为用户提供简单易用的音乐创作。音乐爱好者或者歌手只需输入灵感,AI能辅助完成词、曲、编、唱,生成AI初稿后,支持词曲协同调整。用户无需专业音乐知识,通过选择风格、节奏等参数,快速生成个性化的音乐作品。
Lyrics Into Song AI 是一款在线AI音乐创作工具,能够将文字歌词转换成完整的歌曲。通过分析歌词的情感和节奏,自动生成旋律、和声和编曲,支持多种音乐风格。
StableAudio 是Stability AI 提供的AI音乐创作平台。平台通过文本生成音乐(Text-to-Audio)和音频生成音频(Audio-to-Audio)的方式,用户只需输入文字描述或上传音频素材,能生成符合要求的音乐。平台支持生成长达3分钟的音频,格式为44.1kHz立体声。
TextToSpeech是免费在线AI文字转语音工具,支持50多个国家的语言和8000多种音色。用户可以轻松输入文本,选择语言和语音风格,调整语速和音量,然后生成听起来自然的高质量语音。
TTSMaker是马克配音(MakVoice)推出的免费AI文字转语音工具,提供多语言和多种语音风格的AI配音服务。用户可以输入文本,选择语言和声音,然后一键转换成自然流畅的语音。平台支持50+语种和300+语音包,满足个性化配音需求。
LOVO AI是专业的AI文字转语音工具,提供500+声音和100种语言的文本转语音服务。专为营销、培训、社交媒体等视频内容创作设计,支持无缝音频视频同步、自动字幕生成、AI写作辅助和声音克隆技术。
Uberduck是一个开源的AI语音生成和合成的社区,该平台提供了超过5000多种声音帮助用户制作AI配音和语音,甚至你还可以使用自己的自定义语音克隆进行合成。
Sonauto是一款基于人工智能技术的免费在线音乐创作工具,能够根据用户提供的文本提示、歌词或旋律,转换成具有特定风格的完整歌曲。
天工SkyMusic是昆仑万维推出的国内首个音乐SOTA模型,采用自研的大模型音乐音频生成技术,能够实现端到端的音乐创作,包括乐器、人声、旋律等元素的一体化生成。
大饼AI变声(Dubbing.tech)是一款功能强大、免费专业的实时语音变声软件,是国内首款基于AI深度学习的声音引擎,并且支持全场景切入,兼容和支持多种游戏以及语音客户端。大饼AI变声的音色丰富,有数百种音色可供选择,每期提供免费的变声音色。除了实时变声,大饼声音引擎SaaS版还提供了文字转语音、声音克隆、声音定制、声音转换等功能,全方位地满足对多元声音的需求。
Supertone Shift是由韩国的AI音频初创公司Supertone推出的一款AI驱动的实时语音变换软件,通过先进的人工智能技术,让用户能够迅速切换并个性化定制多种高品质声音。
Producer.ai 是 AI 音乐创作平台。通过先进的 AI 技术,为用户提供了一个简单易用的音乐创作环境,帮助用户激发创造力并快速生成音乐作品。用户可以通过自然语言与平台的核心功能,Producer 进行交互,生成音乐、歌词,进行混音和替换作品中的部分段落。
Adobe Podcast 是Adobe推出的在线AI音频录制和编辑工具,专为播客创作者、声音工作者及内容创作者设计。工具基于 AI 技术优化语音质量,去除背景噪音和回音,让声音清晰且专业。
“网易云音乐·X Studio”是由网易云音乐与小冰公司最新联合推出的AI歌手音乐创作软件,面向广大音乐人和音乐爱好者免费使用。该软件可帮助音乐人轻松创作高质量的AI新世代音乐作品,是全球主流音乐平台与人工智能公司联手打造的首个同类产品。
刺鸟配音是刺鸟科技推出的专业AI配音工具,提供多种配音服务,深受千万用户喜爱。网站提供了热门配音作品,包括动漫、影视作品和萌宠视频等,内容丰富多样。
Wondercraft是一款多功能的AI音频内容创作平台,通过生成式AI语音技术,允许用户将文本内容迅速转化为播客、有声书、广告等多种音频形式。
Fryderyk是一款AI音乐创作工具,是你的音乐创作智能伙伴。集成了多种乐器声音,包括原声吉他、尼龙弦吉他、电贝斯、钢琴和萨克斯等,为用户提供丰富的音乐元素选择。
Voicenotes是由Buy Me a Coffee的创始人推出的一款集成了人工智能技术的智能语音笔记工具,允许用户通过录音来记录想法和信息,并将这些录音自动转录成文本。
OptimizerAI是一款人工智能声音效果生成工具,能够根据文字提示自动创造出适合多种场景的声音和音效,如游戏中的射击声、动画中的雨声环境或地铁到站声等,专为视频创作者、游戏开发者、艺术家和视频制作人员设计。
ACE Studio是时域科技推出的免费AI音乐合成工具,基于AI技术帮助用户快速生成专业品质的歌声和乐器演奏。
蓝藻AI是云知声公司开发的人工智能内容创作平台,专注于AI声音克隆、文字配音和文案创作服务。用户可以通过该平台训练克隆个性化的语音模型,生成与原音相似的合成音频,或选择多样的AI发音人进行文字配音,同时提供细致的声音调节选项。
Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台,核心产品是强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API,让开发者能够快速将语音转录和理解功能集成到他们自己的应用程序和服务中。
Audiobox是Meta推出的免费AI语音和声音生成模型,能结合语音输入和自然语言文本提示生成语音和音效。模型包含Audiobox Speech(专注语音生成)和Audiobox Sound(专注音效生成)等专业模型,底层基于共享的自监督模型Audiobox SSL。
RESEMBLE.AI 是基于人工智能技术生成逼真和个性化语音的平台。通过深度学习算法分析真实人类声音样本,学习其独特的发声模式和语言特征,然后根据用户输入的文本生成相似的语音。可以用于多种应用场景,如内容创作、电影和动画产业、广告行业以及个人使用等。
IBM Watson文字转语音
FakeYou 是AI文本转语音平台,用户输入文本,选择喜欢的卡通角色或名人声音,角色能“说出”自己想要的内容。平台支持文本到语音、语音转换、语音克隆等多种功能,且提供零样本语音合成技术,没有大量样本也能生成逼真的声音。
BGM猫是北京灵动音科技有限公司推出的AI智能生成BGM音乐的工具,用户只需选择音乐时长和对应标签工具能自动生成BGM。
快转字幕是由广州比高网络科技推出的一款语音视频转文字字幕的平台,可智能识别音视频内容,将其转录为文字版本。该工具通过先进的语音识别技术,高效省时地为无字幕音视频添加高准确率的字幕,避免了传统手工打字或使用低质量转录工具后所需的繁琐手动校正,提升了自媒体工作者在视频制作中的工作效率。此外,快转字幕不仅提供快速、准确的字幕服务,还支持多种语言和字幕翻译功能,使内容创作者能够更容易地触及全球观众。
悦音配音是制片帮旗下推出的一款AI智能在线配音语音合成工具,可以帮助用户在线将文字输入快速轻松转换成语音。该AI配音工具提供男声、女声、童声、普通话、方言、英文等多种真人声音,在你输入文字后便可以直接智能生成音频。
音虫SoundBug是一款由国内团队研发的数字音频工作站(DAW)软件,以其简洁直观的用户界面和易于上手的操作特点,为音乐爱好者提供了一套完整的音乐制作工具。SoundBug支持Windows和Mac电脑端使用,内置了AI编曲、丰富的音色库和必要的音频编辑功能。
Mubert 是AI音乐生成平台,通过简单易用的方式为用户提供个性化的音乐创作和使用体验。用户可以通过输入关键词(如音乐风格、情绪、场景等)来生成符合需求的免版税音乐,适用于视频背景、播客配乐、商业项目等多种场景。
beatoven.ai是AI音乐生成平台,旨在为视频、播客和游戏制作者提供版权免费的背景音乐。用户只需输入音乐想法,能快速生成超过250种风格的音乐。平台支持个性化定制,包括音乐长度、风格、情绪和乐器选择,满足不同创作需求。
BeatBot是一个AI歌曲和音乐生成工具,用户只需输入文本描述,点击Generate按钮便可以快速生成不同风格的音乐。
Audo Studio 是AI音频处理工具,能快速去除背景噪音、增强语音。工具操作简单,只需一键能完成音频清理,适合播客、YouTube 创作者和音频视频制作人员使用。
NaturalReader 是AI文本转语音工具,能将各类文本转换为自然流畅的语音,支持 PDF 等 20 多种格式和 50 多种语言。
转录和理解语音的AI模型
LALAL.AI是AI音乐音频处理工具,能快速、精准地将音频或视频中的人声、伴奏、鼓、贝斯等不同音轨分离,支持多种音频和视频格式(如MP3、WAV、MP4等)。
Krisp是人工智能驱动的音频处理软件,提升通话和会议的语音质量。通过先进的AI技术,能实时消除背景噪音和人声干扰,让通话更加清晰。Krisp支持双向降噪,能消除你听到的噪音,能确保对方听不到你的背景杂音。
超真实在线AI语音生成
Murf AI 是多功能的AI语音生成器,专为企业和创作者设计。工具支持 200 多种语音和 20 多种语言,能快速将文本转换为逼真的语音配音。
Lemonaid是一款AI音乐生成工具,专为专业音乐人设计,能自动生成具有旋律、和声和节奏的音乐作品。提供多种风格的音乐生成模式,用户可以根据个人喜好选择音乐类型和节拍,自定义音乐生成过程。
Soundraw是专为创作者打造的AI音乐生成器,能根据用户设置的参数(如流派、情绪、乐器、时长等)快速生成背景音乐。用户可以通过简单的操作,选择音乐风格(如流行、嘻哈、古典等),调整节奏、音量、乐器组合等,生成符合需求的音乐片段。
Boomy是AI驱动的音乐创作平台,支持用户通过选择不同的音乐风格和流派,快速生成原创音乐作品。平台提供直观的界面和强大的编辑工具,支持音乐的个性化定制和分发。
Typecast 是先进的AI语音生成平台,支持将文本高效转化为自然流畅的语音内容。平台提供丰富多样的语音风格,涵盖不同年龄、性别和场景,支持多语言生成,能通过智能情感识别技术,根据文本上下文自动调整语音的情感和语调。
Veed推出的AI语音生成器
Clipchamp AI 旁白生成器是Clipchamp推出的在线AI语音生成工具,能将文本快速转换为逼真的语音画外音。
AI实时变声工具
Speechify 是强大的文字转语音(TTS)工具,支持多平台(如 iPhone、iPad、Android、Mac、网页版、Chrome 扩展等),能轻松朗读任何文档、文章、书籍、PDF和电子邮件。
AI文本到语音生成工具
Voice.ai 是先进的实时AI变声工具,提供高质量的语音解决方案。平台支持文本到语音(TTS)、语音克隆、语音变声等多种功能,能生成高度逼真的语音,支持多种语言和方言。
Listnr 是先进的AI语音合成工具,能将文本快速转化为自然流畅的语音。工具支持超过142种语言和1000多种声音风格,支持用户克隆自己的声音。
Voicemod 是强大的AI实时语音变声工具,提供音效控制界面。工具基于先进的 AI 技术,让用户能在语音通话、游戏、直播等场景中轻松改变声音,提供超过150种变声效果和数千种音效。
WellSaid 是 AI 语音生成工具,提供高质量、自然逼真的语音生成服务。工具拥有超过120种自然声音,涵盖多种语言和风格,基于专业配音演员的授权录音,确保语音的高质量和多样性。
Notta是语音转文本工具,能将音频和视频内容实时转录成文字,支持多达 58 种语言。工具自动生成会议摘要、提取关键信息和行动项,将重要内容剪辑成片段分享给团队成员。
听脑AI是专业智能录音助手,采用AI技术实现实时语音转写,准确率98%。支持会议记录、课堂笔记、销售通话等场景,提供实时转写、多人识别、智能总结功能。快速处理本地及网络音视频,支持多语言,3分钟总结1小时会议内容,让沟通更高效。
简单听记是百度网盘推出的AI语音转文字工具,能将音频文件快速转换成文字,支持编辑和格式调整,生成规范的会议纪要。简单听记支持多种音频格式,提供多种预设模板,并具备实时转录和自动化处理的能力。
通义听悟是阿里云推出的工作学习AI助手,依托通义千问语言模型、音视频AI模型能力,为用户提供实时语音转写、音视频文件转写、实时翻译、智能提炼关键信息等多种功能,带来音频和视频内容记录和阅读的全新体验。