đŸ Archived View for idiomdrottning.org âș texttv-dalig captured on 2022-01-08 at 13:41:28. Gemini links have been rewritten to link to archived content
âŹ ïž Previous capture (2021-12-03)
-=-=-=-=-=-=-
Den nya versionen av SVTs text-tv kom upp idag.
Jag har uppdaterat min scraper att klara det nya formatet.
Jag hade rÀtt lÄga förvÀntningar och tyvÀrr Àr den nya versionen mycket riktigt sÄ otroligt dÄlig!
Den har gÄtt frÄn att vara pre-block med lÀnkade sidnummer till att vara giffar!
Det gĂ„r alltsĂ„ inte att följa lĂ€nkarna lĂ€ngre, i den gamla gick det att klicka sig runt pĂ„ sidnumren men i den nya mĂ„ste man skriva in. Dvs man mĂ„ste alltsĂ„ anvĂ€nda tangentbord! Och man kan inte lĂ€ngre stĂ€lla in vanlig fontsize osv utan det Ă€r âhoppas du gillar retropixelblockâ som gĂ€ller.
Giffarna Àr dessutom inbÀddade i sidorna i base64. FÀrre TLS-roundtrips pÄ det sÀttet och det Àr ju mysigt, men gÄr Ä andra sida inte att slippa ladda ner dom för oss som bara vill ha texten.
Med en skÀrmlÀsare för synskadade Àr den nya ocksÄ rÀtt sÄ wack eftersom den inte kan skilja ut nya rader pÄ nÄt bra sÀtt. Det finns ingen semantik som hjÀlper en att höra skillnad pÄ rubrik, sidhuvud, sidfot, och sjÀlva texten, utan den mal bara pÄ.
Det Ă€r sjĂ€lvklart ocksĂ„ betydligt mer tracing, cookies och analytics pĂ„ den nya. HĂ„hĂ„jajaâŠ
Den gamla hemsidan var helt OK, men jag gjorde en scraper för att jag tyckte det var lite jobbigt att nya rubriker inte kom lÀngst fram. Av begripliga skÀl: det gör att sidnumren inte byts ut i onödan utan att nyhet nummer 110 (eller vad det nu Àr) ligger pÄ 110 lite lÀngre Àn om allt hela tiden skulle skyfflas runt nÀr det kom en nyhet. Men med min scraper sÄ Àr det meningen att dom nyaste sakerna ska komma överst.
Den gör ju sĂ„ gott den kan att klara av det⊠Ett problem Ă€r att sidorna ibland randomly inte dyker upp. âSidan Ă€r ej i sĂ€ndningâ stĂ„r det, trots att den fanns dĂ€r nyss och om jag reloadar finns den dĂ€r igen. Det kan innebĂ€ra att scrapern âglömmer bortâ att den har sett en viss sida och tror att det Ă€r en nyhet. Och om dom gör typofixes sĂ„ tror den ocksĂ„ att den Ă€r en helt ny (dvs jag har ingen Levenshtein-tröskel, kanske vore en bra idĂ©, iofs). Eller om dom flyttar en rubrik frĂ„n huvudrubrik till notis, eller om dom tar bort och sen Ă„terinsĂ€tter en nyhet, eller om den faller bort frĂ„n innehĂ„llsförteckningen. Men allt det Ă€r vĂ€l OK.
Den nya versionen dÀremot⊠nu kÀnns min scraper sÄ sjukt mycket mer berÀttigad! För det har blivit en total pain att anvÀnda den officiella.
Det var lite knepigt att göra den nya; med den gamla behövde jag bara köra sxpath a href för att plocka ut alla relevanta sidnummer frĂ„n innehĂ„llssidorna, med den nya Ă€r det en⊠sjutton rader lĂ„ng named let. UjâŠ
Det konstiga Àr: varför?
Varför blir webben bara sÀmre och sÀmre?
Ska det vara sÄ svÄrt för dom att trycka View Source pÄ sin egen kod istÀllet för att koka ihop en ohemul gegga?
Ja, jo, den nya har vĂ€l en högre âretroleksaksfaktorâ dvs det ser ut som det gjorde pĂ„ 90-talet, nĂ€r Text-TV hade sin största publik. (Den stora GDPR-blobban förtar ju en hel del av det intrycketâŠ) Som sagt, mer tracing och tracking och cookies för det Ă€r vĂ€l urviktigt för dom att fĂ„ veta hur folk anvĂ€nder Text-TV.
Men jag orkar inteâŠ!