hf是什么| 蔻驰手表属于什么档次| cd什么意思| 尿酸高吃什么药好| 宫颈炎吃什么药最好| 血压高吃什么降压药| 藿香正气胶囊治什么病| 伊朗用什么语言| 维酶素片搭配什么药治萎缩性胃炎| sheep是什么意思| 平和是什么意思| 幼儿园报名需要什么资料| 作怪是什么意思| 十二指肠溃疡吃什么药| 为什么会头晕| 花重锦官城的重是什么意思| 人流后吃什么补身体| 尿急憋不住尿是什么原因| ca199检查是什么意思| 汗味重是什么原因| 为什么牙齿会发黑| 吃什么减肚子上的赘肉最快| 什么人不适合做纹绣师| 朵的第二笔是什么| 萎缩性胃炎是什么原因引起的| 冬虫虫念什么| 心律不齐是什么原因| 血压低压高是什么原因造成的| 属虎和什么属相最配| 副营级是什么军衔| 越来越瘦是什么原因| 甜醋是什么醋| sample是什么意思| 胆固醇高是什么症状| 1967年是什么年| 梦见房子是什么意思| pa是什么意思| 8月份什么星座| 阴阳失调是什么意思| 胡子为什么长得快| 刘胡兰是什么样的人| 涂防晒霜之前要涂什么| 银杏果什么时候成熟| 食谱是什么意思| 食物中毒吃什么药| 养神经的药是什么药最好| 混纺棉是什么面料| 喝什么降血压| 风热感冒吃什么药| 胆红素偏高有什么危害| 王姓为什么出不了皇帝| 痰多吃什么化痰| 互粉是什么意思| 一什么树林| 奶粉可以做什么美食| 男生为什么会晨勃| 五行什么意思| 舌苔白是什么原因| 桥本甲状腺炎是什么| 有机会是什么意思| 水满则溢月盈则亏是什么意思| 三级警督是什么级别| 2003年五行属什么| 梦见眉毛掉了什么预兆| 喝铁观音茶有什么好处| 白细胞偏低是什么原因| 娅字五行属什么| 乳糖不耐受不能吃什么| 舌头肥厚是什么原因| 血崩是什么意思| 年薪20万算什么水平| 木命人五行缺什么| 牙冠什么材质的好| 淋巴结肿大是什么原因| 水煮鱼一般用什么鱼| 什么鸟叫声最好听| 吃什么会变黑| 2003年属什么生肖| 白露是什么季节的节气| 肌酐700多意味着什么| 饿了么什么时候成立的| 此是什么意思| 曦字五行属什么| 喝什么茶对肝脏好| 东方为什么红| 孕晚期破水是什么症状| 05年属什么生肖| 增强免疫力吃什么药| 男生染头发什么颜色好看| 小鸡喜欢吃什么食物| 1938年属什么生肖| 养狗人容易得什么病| 伸张正义是什么意思| 衬衫配什么裤子好看| 漳平水仙茶属于什么茶| 女兔配什么属相最好| 什么是粘胶纤维| 火影忍者大结局是什么| 早上起床吐痰带血是什么原因| 梦见发洪水是什么征兆| 食指比无名指长代表什么| 血管变窄吃什么能改善| 洋葱不能跟什么一起吃| 老放屁是什么病的征兆| 不堪入目是什么意思| 化橘红是什么东西| 牛磺酸有什么作用| 拉肚子吃什么| 腺样体挂什么科| 下巴起痘痘是什么原因| 指甲有条纹是什么原因| 生物酶是什么东西| 水瓶座是什么象| 肌肉萎缩什么症状| 什么泡水喝降甘油三酯| 人死后为什么要守夜| 什么食物含碘| 为什么会一直打嗝| 做梦笑出声是什么预兆| 西洋参补什么| 抖m是什么意思| 平均红细胞体积偏高是什么原因| 扁导体发炎吃什么药| 吃什么美容养颜抗衰老| 舌根部淋巴滤泡增生吃什么药| 月经老是提前是什么原因| 梅毒为什么会自愈| 生孩子前要注意什么| 名士手表属于什么档次| 被弹颏是什么意思| 20是什么意思| 十二月二十号是什么星座| 流鼻血是什么引起的| 此地无银三百两是什么意思| 补钾吃什么药| 五什么六什么的成语| 蚕豆病是什么| 结婚32年是什么婚| 血管瘤长什么样子图片| 脑血管痉挛是什么原因引起的| 赵本山是什么学历| 端的是什么意思| 吃什么容易结石| 北京豆汁什么味道| 宽宏大度是什么生肖| 女孩叫锦什么好听| 肝上火有什么症状| 世界八大奇迹是什么| 捐肾对身体有什么影响| 孛儿只斤现在姓什么| 正常尿液是什么味道| 高铁列车长是什么级别| 胃酸过多吃什么好| 舒筋健腰丸主治什么| 什么样的疤痕影响当兵| 吃什么补充维生素c| 28岁属什么生肖| 77岁属什么生肖| 移车打什么电话| 热天不出汗是什么原因| 化疗是什么样的过程| 乳腺导管扩张是什么意思严重吗| 打蛇打七寸是什么意思| 口腔溃疡是什么| 人类是什么时候出现的| 25分贝相当于什么声音| 饱胀是什么意思| 女的右眼跳代表什么| 血去掉一撇念什么| 后背疼吃什么药| 水黄是什么原因| 18k金是什么材质| 皮秒是什么| 头脑胀痛什么原因| 解脲脲原体阳性是什么意思| 肠炎吃什么药| 10月份什么星座| 心脏呈逆钟向转位什么意思| 梦见自己被抢劫了预示什么| 频繁做梦是什么原因| 执子之手与子偕老是什么意思| 忧愁是什么意思| 什么是同房| 什么犹如什么造句| 反应性增生是什么意思| 女人左眼跳是什么预兆| 骨结核是什么病| 谷草转氨酶偏高是什么原因| 甲胎蛋白偏低说明什么| 蜂蜜和柠檬一起喝有什么作用| 苹果什么时候吃最好| 心烦意乱焦躁不安吃什么药| 当驾校教练需要什么条件| 排斥一个人什么意思| 梦见好多蚊子是什么意思| 突然头晕是什么情况| 跳蚤最怕什么东西| 甲亢与甲减有什么区别| 女生肚脐眼下面疼是什么原因| 20岁长白头发是什么原因造成的| 梦见掉了一颗牙齿是什么征兆| 落差是什么意思| 脑膜瘤钙化意味着什么| 四川有什么好大学| 什么的朝霞| 心肌病吃什么药| 手掌发黄是什么原因| 女人养颜抗衰老吃什么最好| 莫拉古是什么意思| 水瓶座和什么座最配对| 红加黄等于什么颜色| 5点是什么时辰| 变色龙指什么样的人| 豆蔻年华什么意思| 渡劫是什么意思| 五险一金的一金是什么| 打摆子是什么病| 得理不饶人什么意思| 胆囊息肉是什么意思| roa是什么| 金达克宁和达克宁有什么区别| 老做梦是什么原因| 酒后吃什么水果好| 什么叫湿疹| 产后第一次来月经是什么颜色| 家庭养什么狗最干净| 成吉思汗是什么意思| 送向日葵代表什么意思| 西洋参吃多了有什么副作用| 流产吃什么药| 什么游戏赚钱| 五味子不适合什么人喝| 脑血栓是什么意思| 蝙蝠属于什么类| 小孩过敏吃什么药最好| 小case是什么意思| 114514什么意思| 突然肚子疼是什么原因| 什么石头最值钱| 老年人头晕挂什么科| 帕金森病是什么原因引起的| 艾灸是什么| 腊肉和什么菜炒好吃| 肾囊肿是什么病| 肾结石用什么药| 脑淤血是什么原因引起的| 憩是什么意思| 月亮为什么会变成红色| 今年七夕节是什么时候| 原是什么意思| 科伦是什么药| 何去何从是什么意思| 蓝光有什么作用| 肋间神经痛用什么药| 还有什么寓言故事| 青黛色是什么颜色| 什么的云朵| 不典型增生是什么意思| 薄荷泡水喝有什么好处| 吃了小龙虾不能吃什么| 双手麻木是什么原因| 卤肉是什么肉| 产妇吃什么下奶快又多又营养| gm是什么单位| 百度
Skip to content

An Open Source Python alternative to NotebookLM's podcast feature: Transforming Multimodal Content into Captivating Multilingual Audio Conversations with GenAI

License

Notifications You must be signed in to change notification settings

souzatharsis/podcastfy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?

Repository files navigation

Podcastfy.ai | Trendshift

Podcastfy.ai ?????

An Open Source API alternative to NotebookLM's podcast feature: Transforming Multimodal Content into Captivating Multilingual Audio Conversations with GenAI

podcastfy.mp4

Paper | Python Package | CLI | Web App | Feedback

Open In Colab PyPi Status PyPI Downloads Issues Pytest Docker Documentation Status License GitHub Repo stars

Podcastfy is an open-source Python package that transforms multi-modal content (text, images) into engaging, multi-lingual audio conversations using GenAI. Input content includes websites, PDFs, images, YouTube videos, as well as user provided topics.

Unlike closed-source UI-based tools focused primarily on research synthesis (e.g. NotebookLM ??), Podcastfy focuses on open source, programmatic and bespoke generation of engaging, conversational content from a multitude of multi-modal sources, enabling customization and scale.

Testimonials ??

"Love that you casually built an open source version of the most popular product Google built in the last decade"

"Loving this initiative and the best I have seen so far especially for a 'non-techie' user."

"Your library was very straightforward to work with. You did Amazing work brother ??"

"I think it's awesome that you were inspired/recognize how hard it is to beat NotebookLM's quality, but you did an incredible job with this! It sounds incredible, and it's open-source! Thank you for being amazing!"

Star History Chart

Audio Examples ??

This sample collection was generated using this Python Notebook.

Images

Sample 1: Senecio, 1922 (Paul Klee) and Connection of Civilizations (2017) by Gheorghe Virtosu


Senecio, 1922 (Paul Klee) Connection of Civilizations (2017) by Gheorghe Virtosu

senecio.mp4


Sample 2: The Great Wave off Kanagawa, 1831 (Hokusai) and Takiyasha the Witch and the Skeleton Spectre, c. 1844 (Kuniyoshi)


The Great Wave off Kanagawa, 1831 (Hokusai) Takiyasha the Witch and the Skeleton Spectre, c. 1844 (Kuniyoshi)

japan.mp4


Sample 3: Pop culture icon Taylor Swift and Mona Lisa, 1503 (Leonardo da Vinci)


Taylor Swift Mona Lisa

taylor.mp4

Text

Audio Description Source
souza.mp4
Personal Website Website
Audio (longform=True) Lex Fridman Podcast: 5h interview with Dario Amodei Anthropic's CEO Youtube
Audio (longform=True) Benjamin Franklin's Autobiography Book

Multi-Lingual Text

Language Content Type Description Audio Source
French Website Agroclimate research information Audio Website
Portuguese-BR News Article Election polls in S?o Paulo Audio Website

Quickstart ??

Prerequisites

  • Python 3.11 or higher
  • $ pip install ffmpeg (for audio processing)

Setup

  1. Install from PyPI $ pip install podcastfy

  2. Set up your API keys

Python

from podcastfy.client import generate_podcast

audio_file = generate_podcast(urls=["<url1>", "<url2>"])

CLI

python -m podcastfy.client --url <url1> --url <url2>

Fastapi (Beta for urls)

Containerize podcastify and launch the api
Dockerfile_api

Make requests to the api look at the notebook for a clear example
fetch_audio(request_data, ENDPOINT, BASE_URL)

Usage ??

Customization ??

Podcastfy offers a range of customization options to tailor your AI-generated podcasts:

Features ?

  • Generate conversational content from multiple sources and formats (images, text, websites, YouTube, and PDFs).
  • Generate shorts (2-5 minutes) or longform (30+ minutes) podcasts.
  • Customize transcript and audio generation (e.g., style, language, structure).
  • Generate transcripts using 100+ LLM models (OpenAI, Anthropic, Google etc).
  • Leverage local LLMs for transcript generation for increased privacy and control.
  • Integrate with advanced text-to-speech models (OpenAI, Google, ElevenLabs, and Microsoft Edge).
  • Provide multi-language support for global content creation.
  • Integrate seamlessly with CLI and Python packages for automated workflows.

Built with Podcastfy ??

Updates ????

v0.4.0+ release

  • Released new Multi-Speaker TTS model (is it the one NotebookLM uses?!?)
  • Generate short or longform podcasts
  • Generate podcasts from input topic using grounded real-time web search
  • Integrate with 100+ LLM models (OpenAI, Anthropic, Google etc) for transcript generation

See CHANGELOG for more details.

License

This software is licensed under Apache 2.0. See instructions if you would like to use podcastfy in your software.

Contributing ??

We welcome contributions! See Guidelines for more details.

Example Use Cases ????

  • Content Creators can use Podcastfy to convert blog posts, articles, or multimedia content into podcast-style audio, enabling them to reach broader audiences. By transforming content into an audio format, creators can cater to users who prefer listening over reading.

  • Educators can transform lecture notes, presentations, and visual materials into audio conversations, making educational content more accessible to students with different learning preferences. This is particularly beneficial for students with visual impairments or those who have difficulty processing written information.

  • Researchers can convert research papers, visual data, and technical content into conversational audio. This makes it easier for a wider audience, including those with disabilities, to consume and understand complex scientific information. Researchers can also create audio summaries of their work to enhance accessibility.

  • Accessibility Advocates can use Podcastfy to promote digital accessibility by providing a tool that converts multimodal content into auditory formats. This helps individuals with visual impairments, dyslexia, or other disabilities that make it challenging to consume written or visual content.

Contributors

contributors

↑ Back to Top ↑

About

An Open Source Python alternative to NotebookLM's podcast feature: Transforming Multimodal Content into Captivating Multilingual Audio Conversations with GenAI

Topics

Resources

License

Code of conduct

Stars

Watchers

Forks

Sponsor this project

 

Packages

 
 
 

Languages

闰月给父母买什么 dha宝宝什么时候吃最好 符号是什么意思 现在流行什么样的衣柜 人模狗样是什么生肖
闭口是什么样子图片 驿马星是什么意思 酉鬼念什么 低血糖什么症状有哪些 善哉善哉是什么意思
人造珍珠是什么材质 什么水果糖分最高 什么叫2型糖尿病 诺贝尔为什么没有数学奖 lily是什么花
1.20是什么星座 尿酸碱度是什么意思 mido手表什么牌子 徒刑是什么意思 香港代购什么东西好
眼白发黄是什么原因hcv9jop1ns8r.cn 夏季吃桃子有什么好处hcv8jop6ns1r.cn 陶渊明是什么朝代hcv9jop4ns3r.cn 护理学是干什么的hcv7jop6ns4r.cn 菠萝与凤梨有什么区别hcv7jop5ns4r.cn
艾灸痒痒的是什么原因mmeoe.com 牙齿经常出血是什么原因hcv9jop6ns0r.cn 头发出汗多是什么原因hcv8jop1ns2r.cn 妇检tct是什么检查hcv8jop7ns0r.cn 错觉是什么意思hcv9jop8ns2r.cn
参加白事回来注意什么dayuxmw.com 什么是直接胆红素hcv7jop5ns2r.cn 过敏输液输什么药好hcv8jop2ns3r.cn 什么是碧玺ff14chat.com 男人嘴唇薄代表什么hcv7jop4ns8r.cn
汪星人什么意思hcv8jop2ns4r.cn 4月份什么星座hcv9jop3ns7r.cn 胃窦在胃的什么位置hcv7jop9ns4r.cn 什么水解酒520myf.com 子宫附件包括什么hcv8jop7ns4r.cn
百度