💾 Archived View for betahowto.duckdns.org › yggdrasil:sites_and_services:search_services:yo captured on 2024-03-21 at 15:52:44. Gemini links have been rewritten to link to archived content
⬅️ Previous capture (2024-02-05)
-=-=-=-=-=-=-
Поисковая площадка для сети Yggdrasil с открытым исходным кодом ( https://github.com/YGGverse/Yo ) с минимальным заимствованием наработок архивного YGGo ( gemini://betahowto.duckdns.org/archive:yggdrasil:sites_and_services:search_services:yggo )
Целью проекта является переход на более актуальные программные решения, желание сделать проект доступным для быстрой и удобной установки а также сокращение издержек на обслуживающие сервера.
База данных импортирована с YGGo, но отсутствуют снимки в виду смены их архитектуры (доступен архив ( https://github.com/YGGverse/YGGo#database-snaps ) ~14 Гб).
Для установки достаточно выполнить несколько команд, описанных в разделе README ( https://github.com/YGGverse/Yo#install )
Приложение самостоятельно создаст индексы на основании единственного файла настроек.
Все необходимые для работы настройки собраны в файл json (пример ( https://github.com/YGGverse/Yo/blob/main/example/config.json ))
Платформа изначально создана для поиска контента в сети Yggdrasil но также может быть использована для организации локального или публичного поискового сервера для сети Интернет.
Чтобы осуществлять поиск в сети Yggdrasil, достаточно изменить правила сбора ссылок, например:
"a:not([rel=nofollow])": { "attribute":"href", "external":true, }, "image": { "attribute":"src", "external":true, }, ...
По аналогии можно добавить поддержку доменов .ygg или сделать поиск только по указанной зоне:
Если не планируется сбор / архивирование медиа контента, можно удалить соответствующие конструкции селекторов.
Не смотря на то, что с помощью регулярных выражений можно сделать то же самое, для удобства добавлены дополнительные фильтры подстроки:
"skip": { "stripos": { "url": [ "#", "javascript:", "mailto:", "magnet:", "xmpp:" ] } }
Очень просто можно перевести приложение в режим локального поиска по сайту, указав в настройках
"external":false
Чтобы принимать запросы на индексацию через поисковое поле, нужно включить опцию
"webui": { "search": { "index": { "request": { "url": { "enabled":true,
также можно указать фильтры адресов с помощью регулярного выражения в поле "regex"
Сервер Manticore предусматривает несколько базовых сценариев для выполнения бекапов:
Данный способ подойдет узлам, предоставляющих публичный доступ к собранным данным посредством текстового дампа в формате SQL.
При таком подходе, по расписанию выполняется команда mysqldump:
@monthly mysqldump -h0 -P9306 manticore > /var/www/html/index.sql 2>&1
Чтобы не останавливать сканер, можно указать флаг
--lock-tables=false
а также исключить дополнительные таблицы, если они не нужны
--ignore-table=manticore.yo_some_document
На основном сервере, дамп генерируется раз в месяц, а последняя его версия - всегда доступна по ссылке /index.sql в корне соответствующего сайта: http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/index.sql | версия IPv6 , yo.ygg ( http://yo.ygg/index.sql ) и т.д.
Владельцы могут ограничить канал для загрузки дампов посредством http:
location = /index.sql { limit_rate 50k; # ограничение будет срабатывать после 100 Мб # limit_rate_after 100m; }
История снимков на данный момент не опубликована в виду дисковых ограничений и вероятно, этот процесс будет автоматизирован последством создания периодических торрент ( gemini://betahowto.duckdns.org/yggdrasil:bittorrent:bittorrent ) раздач.
Таким образом, можно выполнить слияние / быстро развернуть приватный или общий поисковый сервер с нуля, без лишнего обращения к сайтам и затрат времени на сканирование.
Подробнее о логических бекапах ( https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Backup-and-restore-with-mysqldump )
Данный способ подразумевает резервное копирование мета информации сервера, включая бинарные данные.
Подход менее требовательный к ресурсам сервера, может выполнятся чаще для административных нужд.
Подробнее о физических бекапах ( https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Using-manticore-backup-command-line-tool )
Проект на GitHub: https://github.com/YGGverse/Yo ( http://[316:c51a:62a3:8b9::4]/YGGverse/Yo | зеркало )
Официальный сайт Manticore: https://manticoresearch.com
Новости: https://mastodon.social/@YGGverse
Канал KevaChat: http://[201:23b4:991a:634d:8359:4521:5576:15b7]/kevachat/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest | 0200::/7 , алиас ( http://kevachat.ygg/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest )
https://github.com/YGGverse/Yo
gemini://betahowto.duckdns.org/archive:yggdrasil:sites_and_services:search_services:yggo
https://github.com/YGGverse/YGGo#database-snaps
https://github.com/manticoresoftware
https://github.com/YGGverse/Yo/blob/main/composer.json
https://github.com/manticoresoftware/manticoresearch-php
https://github.com/YGGverse/Yo#install
https://github.com/YGGverse/Yo/blob/main/example/config.json
http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/index.sql
gemini://betahowto.duckdns.org/yggdrasil:bittorrent:bittorrent
http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/
http://[316:c51a:62a3:8b9::4]/YGGverse/Yo
https://mastodon.social/@YGGverse
http://kevachat.ygg/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest