💾 Archived View for geddit.phreedom.club › s › 76 captured on 2023-07-22 at 16:23:22. Gemini links have been rewritten to link to archived content
View Raw
More Information
⬅️ Previous capture (2023-07-10)
➡️ Next capture (2023-09-08)
🚧 View Differences
-=-=-=-=-=-=-
Скрижали Аэлиты
🏠 Домой
По-моему неплохая статья о пользе парсинга сайтов и о том, что защита от оного мешает обычным людям, не только роботам
gemi.dev
Прислано 186d ago
Комментарии (9)
Оставить комментарий
- (186d ago) Это смешная (и рекламная!) статья: о жадных людях, продающих "карандаши без грифеля". Именно для них "информация - золото" (а я-то наивно думал, что золото - это человек) // רמי
- (186d ago) Первые из-за жадности пытаются ограничить свободу доступа к тому, что сами же(!) и размещают в сети; вторые - жадно пытаются воспользоваться чужим трудом. Итог: в пролете - все :) // רמי
- (186d ago) Для нормальной обработки geddit вафли вставляйте оригинальные ссылки, без %. Т.е. где / ? и т.д.
- (186d ago) Ну, а если посмотреть с другой стороны, вот например тот же ньюсвафель парсит сайты и выдаёт нормальный читабельный результат без всякого хлама. Является это чем-то плохим?...
- (186d ago) ...А репостеры? А те, кто делают RSS для сайтов, которые его не имеют и всё в подобном духе, короче говоря вытаскивают блоат и показывают чистый контент.
...
- (186d ago) > оригинальные ссылки, без %
Пардон, учту, но ведь по стандарту линки должны быть urlencoded, конечно многие клиенты их и так urlencode перед request, но всё равно спека указывает на юзание именно таких
- (186d ago) Я ж говорю о конкретном материале. От него за версту тянет закамуфлированным набором SEO-слов и скрытым призывом "Купите наши услуги!" Как и от 50% сообщений Хабра. // רמי
- (186d ago) Как горячий сторонник :) соблюдения ЛЮБЫХ лицензий (в т.ч. проприетарных), отвечу так: rss/репосты чужого контента хороши тогда, когда они соблюдают EULA и чужие авторские права // רמי
- (186d ago) Вот почему я: 1) стараюсь создавать свой контент; 2) неохотно публикую чужие материалы; 3) скрупулезно указываю их копирайты. И для облегчения доступа - не вставляю хлам в код сайта // רמי