Anlässlich Hans‘ Mitwirken an der mittlerweile leider eingestellten Hörbuch- und Podcast-Plattform FYEO, reden wir heute über die Herausforderungen, die der Bau eines 1,6 Millionen Podcasts umfassenden Katalogs mit sich bringt.
Schaunotizen
- [00:01:02] Herausforderungen beim Bau eines Podcast-Katalogs
- Zu Beginn klären wir, wie Podcasts eigentlich gehostet, veröffentlicht und verteilt werden. Viele Podcasts nutzen zum Hosten ihrer Audio-Dateien spezialisierte Anbieter wie anchor.fm oder Podigee. Andere, wie wir, hosten ihre Audios selbst (und erzeugen damit 2 Terabytes an Traffic im Monat, Chapeau an dieser Stelle an ALL-INKL.COM).
In beiden Fällen benötigt man dann einen speziellen Podcast-Atom/RSS-Feed, der entweder von den Hosting-Plattformen ausgespuckt wird, oder von der eigenen Webseite, z.B. in Form eines WordPress mit Podcasting-Plugin.
Aufgrund dieses dezentralen Hosting-Ansatzes, werden Podcasts von den Podcast-Katalogen dieser Welt erst einmal gar nicht gefunden. Stattdessen musss man selbst tätig werden, und sie bei allen gewünschten Plattformen eintragen, sei es bei Apple, Google oder Spotify. Am Apple-iTunes-Verzeichnis wiederum bedienen sich viele weitere, kleinere Podcasting-Plattformen, um Podcasts zu finden und zu ihrem eigenen Fundus hinzuzufügen. So lief das auch bei Hans‘ ehemaligen Projekt.
Fortan ging anschließend darum, mit klugen Herangehensweisen zu erreichen, dass von den Podcastmacher*innen veröffentlichte Episoden schnell auf der Podcast-Plattform angezeigt werden. Das ist insofern nicht so einfach, als dass die Podcast-Feeds einem Pull- statt einem Push-Prinzip folgen, man Feeds aber auch nicht unendlich häufig anfragen kann.
Für Podcaster ist es jedenfalls wünschenswert, auf so vielen Plattformen wie möglich vertreten zu sein, damit der Umfang der Hörerschaft wächst, und andererseits auch, um von Statistiken zu Abspielverhalten und Demografie zu profitieren, die diese Anbieter im Gegenzug bereitstellen.
Keine Schaunotizen
- Unsere Audioproducerin Sabine Piel
- Seit Sabine uns unterstützt, schaffen wir es endlich, Episoden regelmäßig zu veröffentlichen 🙏❤
- Wo wir sind ist vorne № 33: Web Performance
- Schepp war zu Gast im sehr empfehlenswerten Frontend-Podcast von Moritz Gießmann und Constantin Groß namens „Wo wir sind ist vorne“. Dort haben die drei einen 3,5-Stunden-Brecher zum Thema „Web Performance“ aufgenommen, bei dem keine Frage mehr offen bleiben dürfte.
Kommentare
Jochen Wersdörfer #
Geschrieben am 8.12.2021 um 14:55
Hi,
vielen Dank für die interessante Episode. Also ja, wie sag ich das jetzt – ich halte das Aktualisieren von 1.6 Millionen Feedurls tatsächlich für nicht so furchtbar problematisch. Aber ich habe das auch noch nicht gemacht, insofern habe ich da gut reden :).
Irgendwann gegen Schluss ging es darum, ob immer die gesamte Audiodatei heruntergeladen werden muss, wenn man irgendwo auf „play“ drückt, oder ob dann ein Range-Request gemacht werden kann. Nun, bei MP3 muss tatsächlich immer die gesamte Datei heruntergeladen werden, weil es da keinen Zeitindex gibt. Damit ist das natürlich ein für Podcasts eher ungeeignetes Format und führt zu einem hohem Trafficverbrauch (2TB *hust*). Das m4a-Format ist da schon deutlich besser, leider funktioniert das auf vielen Android-Telefonen nicht so richtig. Die Formate ogg (ähnlich wie m4a aber ohne Patentprobleme) und opus wären auch super, aber die funktionieren eigentlich weder auf Android noch auf iOS. Es ist ein Kreuz.
Hans #
Geschrieben am 10.12.2021 um 08:35
Hi Jochen,
danke fürs Feedback. Das hört man gerne.
Hehe, lass dich mal ein auf das Experiment und widme der Implementierung so eines Crawlers nen paar Tage. Vielleicht haben wir es einfach unnötig kompliziert gemacht. Bei uns waren über die Zeit unheimlich viele Learnings dabei.
Glücklicherweise ist man schon in der Lage eine MP3 zu streamen, wenn der Server es mit macht. Man muss den
content-range
-Header setzen, dann läuft’s. Wir haben das sowohl für die mobilen Clients auf Android und iOS sowie im Web umgesetzt. Hatte damals auch einen Streaming-Service mit Node gebaut, das war etwas hakelig bis man die richtigen Header gefunden hatte, dann lief’s aber.Viele Grüße
Hans
Roland #
Geschrieben am 16.01.2022 um 15:41
Wollt ihr eure Podcast-Hardware wir bei z.B. Minute 3-5 erwähnt verlinken?
Hans #
Geschrieben am 18.01.2022 um 08:25
Hi Roland, du kannst zu meinem Equipment hier was lesen.
Schepp #
Geschrieben am 18.01.2022 um 08:35
Und ich nutze das hier beschriebene Setup – sowohl unterwegs als auch als Audio-Interface am Rechner: https://sendegate.de/t/profi-klang-fuer-alle-das-hmc660-headset-richtig-einsetzen-fuer-unter-100/3076
RSS-Feed zu diesem Beitrag
Kommentare sind für diesen Beitrag geschlossen.