💾 Archived View for betahowto.duckdns.org › yggdrasil:sites_and_services:search_services:yo captured on 2024-05-10 at 10:52:39. Gemini links have been rewritten to link to archived content

View Raw

More Information

⬅️ Previous capture (2024-03-21)

🚧 View Differences

-=-=-=-=-=-=-

Yo!

Поисковая площадка для сети Yggdrasil с открытым исходным кодом ( https://github.com/YGGverse/Yo ) с минимальным заимствованием наработок архивного YGGo ( gemini://betahowto.duckdns.org/archive:yggdrasil:sites_and_services:search_services:yggo )

Целью проекта является переход на более актуальные программные решения, желание сделать проект доступным для быстрой и удобной установки а также сокращение издержек на обслуживающие сервера.

База данных импортирована с YGGo, но отсутствуют снимки в виду смены их архитектуры (доступен архив ( https://github.com/YGGverse/YGGo#database-snaps ) ~14 Гб).

Технические отличия от YGGo

Установка

Для установки достаточно выполнить несколько команд, описанных в разделе README ( https://github.com/YGGverse/Yo#install )

Приложение самостоятельно создаст индексы на основании единственного файла настроек.

Настройки

Все необходимые для работы настройки собраны в файл json (пример ( https://github.com/YGGverse/Yo/blob/main/example/config.json ))

Yggdrasil

Платформа изначально создана для поиска контента в сети Yggdrasil но также может быть использована для организации локального или публичного поискового сервера для сети Интернет.

Чтобы осуществлять поиск в сети Yggdrasil, достаточно изменить правила сбора ссылок, например:


"a:not([rel=nofollow])":
{
    "attribute":"href",
    "external":true,
},
"image":
{
    "attribute":"src",
    "external":true,
},
...

По аналогии можно добавить поддержку доменов .ygg или сделать поиск только по указанной зоне:


Если не планируется сбор / архивирование медиа контента, можно удалить соответствующие конструкции селекторов.

Не смотря на то, что с помощью регулярных выражений можно сделать то же самое, для удобства добавлены дополнительные фильтры подстроки:


"skip":
{
    "stripos":
    {
        "url":
        [
            "#",
            "javascript:",
            "mailto:",
            "magnet:",
            "xmpp:"
        ]
    }
}

Внешние ссылки

Очень просто можно перевести приложение в режим локального поиска по сайту, указав в настройках


"external":false

Клиентская индексация

Чтобы принимать запросы на индексацию через поисковое поле, нужно включить опцию


"webui":
    {
        "search":
        {
            "index":
            {
                "request":
                {
                    "url":
                    {
                        "enabled":true,

также можно указать фильтры адресов с помощью регулярного выражения в поле "regex"

Резервные копии

Сервер Manticore предусматривает несколько базовых сценариев для выполнения бекапов:

Логический

Данный способ подойдет узлам, предоставляющих публичный доступ к собранным данным посредством текстового дампа в формате SQL.

При таком подходе, по расписанию выполняется команда mysqldump:


@monthly mysqldump -h0 -P9306 manticore > /var/www/html/index.sql 2>&1

Чтобы не останавливать сканер, можно указать флаг


--lock-tables=false 

а также исключить дополнительные таблицы, если они не нужны


--ignore-table=manticore.yo_some_document

На основном сервере, дамп генерируется раз в месяц, а последняя его версия - всегда доступна по ссылке /index.sql в корне соответствующего сайта: http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/index.sql | версия IPv6 , yo.ygg ( http://yo.ygg/index.sql ) и т.д.

Владельцы могут ограничить канал для загрузки дампов посредством http:


location = /index.sql {
	limit_rate 50k;
	# ограничение будет срабатывать после 100 Мб
	# limit_rate_after 100m;  
}

История снимков на данный момент не опубликована в виду дисковых ограничений и вероятно, этот процесс будет автоматизирован последством создания периодических торрент ( gemini://betahowto.duckdns.org/yggdrasil:bittorrent:bittorrent ) раздач.

Таким образом, можно выполнить слияние / быстро развернуть приватный или общий поисковый сервер с нуля, без лишнего обращения к сайтам и затрат времени на сканирование.

Подробнее о логических бекапах ( https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Backup-and-restore-with-mysqldump )

Физический

Данный способ подразумевает резервное копирование мета информации сервера, включая бинарные данные.

Подход менее требовательный к ресурсам сервера, может выполнятся чаще для административных нужд.

Подробнее о физических бекапах ( https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Using-manticore-backup-command-line-tool )

Инстанции

Yggdrasil

Ссылки

Проект на GitHub: https://github.com/YGGverse/Yo ( http://[316:c51a:62a3:8b9::4]/YGGverse/Yo | зеркало )

Ветка для протокола Gemini ( gemini://betahowto.duckdns.org/gemini_protocol ) https://github.com/YGGverse/Yo/tree/gemini

Официальный сайт Manticore: https://manticoresearch.com

Новости: https://mastodon.social/@YGGverse

Канал KevaChat: http://[201:23b4:991a:634d:8359:4521:5576:15b7]/kevachat/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest | 0200::/7 , алиас ( http://kevachat.ygg/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest )

Материалы

https://github.com/YGGverse/Yo

gemini://betahowto.duckdns.org/archive:yggdrasil:sites_and_services:search_services:yggo

https://github.com/YGGverse/YGGo#database-snaps

https://github.com/manticoresoftware

https://github.com/YGGverse/Yo/blob/main/composer.json

https://github.com/manticoresoftware/manticoresearch-php

https://github.com/YGGverse/Yo#install

https://github.com/YGGverse/Yo/blob/main/example/config.json

http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/index.sql

http://yo.ygg/index.sql

gemini://betahowto.duckdns.org/yggdrasil:bittorrent:bittorrent

https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Backup-and-restore-with-mysqldump

https://manual.manticoresearch.com/Securing_and_compacting_a_table/Backup_and_restore#Using-manticore-backup-command-line-tool

http://[201:23b4:991a:634d:8359:4521:5576:15b7]/yo/

http://yo.ygg

http://ygg.yo.index

http://[316:c51a:62a3:8b9::4]/YGGverse/Yo

gemini://betahowto.duckdns.org/gemini_protocol

https://github.com/YGGverse/Yo/tree/gemini

https://manticoresearch.com

https://mastodon.social/@YGGverse

http://[201:23b4:991a:634d:8359:4521:5576:15b7]/kevachat/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest

http://kevachat.ygg/room/NRzhB7LF4Fv5RQUtfhRtnUpTWzArSQ55R2#latest

Навигация

Поиск

Главная страница

Редактировать

Проект β-Doku

Алиас

[0200::/7]

Alfis / Yggdrasil