đŸ’Ÿ Archived View for idiomdrottning.org â€ș texttv-dalig captured on 2023-01-29 at 17:03:03. Gemini links have been rewritten to link to archived content

View Raw

More Information

âŹ…ïž Previous capture (2021-12-03)

-=-=-=-=-=-=-

Text-TV blir dÄlig

Den nya versionen av SVTs text-tv kom upp idag.

Jag har uppdaterat min scraper att klara det nya formatet.

Jag hade rÀtt lÄga förvÀntningar och tyvÀrr Àr den nya versionen mycket riktigt sÄ otroligt dÄlig!

Den har gÄtt frÄn att vara pre-block med lÀnkade sidnummer till att vara giffar!

Det gĂ„r alltsĂ„ inte att följa lĂ€nkarna lĂ€ngre, i den gamla gick det att klicka sig runt pĂ„ sidnumren men i den nya mĂ„ste man skriva in. Dvs man mĂ„ste alltsĂ„ anvĂ€nda tangentbord! Och man kan inte lĂ€ngre stĂ€lla in vanlig fontsize osv utan det Ă€r “hoppas du gillar retropixelblock” som gĂ€ller.

Giffarna Àr dessutom inbÀddade i sidorna i base64. FÀrre TLS-roundtrips pÄ det sÀttet och det Àr ju mysigt, men gÄr Ä andra sida inte att slippa ladda ner dom för oss som bara vill ha texten.

Med en skÀrmlÀsare för synskadade Àr den nya ocksÄ rÀtt sÄ wack eftersom den inte kan skilja ut nya rader pÄ nÄt bra sÀtt. Det finns ingen semantik som hjÀlper en att höra skillnad pÄ rubrik, sidhuvud, sidfot, och sjÀlva texten, utan den mal bara pÄ.

Det Àr sjÀlvklart ocksÄ betydligt mer tracing, cookies och analytics pÄ den nya. HÄhÄjaja


Den gamla hemsidan var helt OK, men jag gjorde en scraper för att jag tyckte det var lite jobbigt att nya rubriker inte kom lÀngst fram. Av begripliga skÀl: det gör att sidnumren inte byts ut i onödan utan att nyhet nummer 110 (eller vad det nu Àr) ligger pÄ 110 lite lÀngre Àn om allt hela tiden skulle skyfflas runt nÀr det kom en nyhet. Men med min scraper sÄ Àr det meningen att dom nyaste sakerna ska komma överst.

Den gör ju sĂ„ gott den kan att klara av det
 Ett problem Ă€r att sidorna ibland randomly inte dyker upp. “Sidan Ă€r ej i sĂ€ndning” stĂ„r det, trots att den fanns dĂ€r nyss och om jag reloadar finns den dĂ€r igen. Det kan innebĂ€ra att scrapern “glömmer bort” att den har sett en viss sida och tror att det Ă€r en nyhet. Och om dom gör typofixes sĂ„ tror den ocksĂ„ att den Ă€r en helt ny (dvs jag har ingen Levenshtein-tröskel, kanske vore en bra idĂ©, iofs). Eller om dom flyttar en rubrik frĂ„n huvudrubrik till notis, eller om dom tar bort och sen Ă„terinsĂ€tter en nyhet, eller om den faller bort frĂ„n innehĂ„llsförteckningen. Men allt det Ă€r vĂ€l OK.

Den nya versionen dĂ€remot
 nu kĂ€nns min scraper sĂ„ sjukt mycket mer berĂ€ttigad! För det har blivit en total pain att anvĂ€nda den officiella.

Det var lite knepigt att göra den nya; med den gamla behövde jag bara köra sxpath a href för att plocka ut alla relevanta sidnummer frĂ„n innehĂ„llssidorna, med den nya Ă€r det en
 sjutton rader lĂ„ng named let. Uj


Men det konstiga

Det konstiga Àr: varför?

Varför blir webben bara sÀmre och sÀmre?

Ska det vara sÄ svÄrt för dom att trycka View Source pÄ sin egen kod istÀllet för att koka ihop en ohemul gegga?

Ja, jo, den nya har vĂ€l en högre “retroleksaksfaktor” dvs det ser ut som det gjorde pĂ„ 90-talet, nĂ€r Text-TV hade sin största publik. (Den stora GDPR-blobban förtar ju en hel del av det intrycket
) Som sagt, mer tracing och tracking och cookies för det Ă€r vĂ€l urviktigt för dom att fĂ„ veta hur folk anvĂ€nder Text-TV.

Men jag orkar inte
!