1. В настоящее время регистрация новых пользователей прекращена. В случае, если у Вас есть какие-либо вопросы о регистрации, или вы хотите зарегистрироваться, о вашем аккаунте или любые другие, то посылайте их по почте dmvasf@gmail.com.

Бэкап

Тема в разделе 'Своя колея', создана пользователем big-bang, 15.11.2021.

  1. Оффлайн

    big-bang Маршал

    На форуме с:
    07.04.2013
    Сообщения:
    116.399
    Симпатии:
    51.576
    Баллы:
    41
    Если у вас на компьютере ОС типа unix, то вы можете воспользоваться нижеприведённым скриптом для того, чтобы считать все ваши сообщения из заданной темы.

    Скрипт написан на шелле sh - для юниксов это стандартный шелл. Но могут быть нюансы, например если у вас Apple iOS (macos).

    Cсылка на тему указывается в переменной temaname в том виде, как она записана в строке броузера при чтении какого-либо сообщения на форуме.

    temanamea - название темы только для информации.

    AUTHOR - это ваш ник.

    По умолчанию считывается вся тема, но можно указать начальную и конечную страницу:

    sh readpage.bat
    sh readpage.bat -s 2
    sh readpage.bat -e 5
    sh readpage.bat -s 2 -e 5

    В компьютере/ОС должны иметься программы

    sed - в юниксах есть
    cat - в юниксах есть
    echo - в юниксах есть
    rm - в юниксах есть
    head - в юниксах есть
    grep - в юниксах есть
    tee - в юниксах есть
    nawk - в юниксах есть
    expr - в юниксах есть
    sleep - в юниксах есть

    информация считывается с Настежа в кодировке UTF-8. Но у меня, например, внутренняя кодировка в компьютере - это iso8859-5 и при считывании информации я перекодирую считанное из UTF-8 в iso8859-5 программой iconv

    iconv -f utf8 -t iso5

    В iOS эта программа также имеется. Если у вас компьютер имеет внутреннюю кодировку UTF-8, то это заклинание можно из текста опустить (с предваряющей его вертикальной чертой - она называется "труба").

    Считывание с форума производится программой wget

    https://en.wikipedia.org/wiki/Wget
    This page was last edited on 24 October 2021, at 22:39 (UTC).
    Скачивается из интернет.

    Вместо неё можно использовать программу curl - она во многих ОС имеется (и в macos):
    https://en.wikipedia.org/wiki/CURL

    Попробую curl. Просто wget у меня установлена и я к ней привык.

    В общем, запустить у себя эту программу - это хорошее упражнение. Подключите детей и внуков если у вас не получится.

    В дальнейшем я сделаю чтобы из темы считывались сообщения нескольких указанных пользователей. Значит можно будет запомнить диалог опустив сообщения спамеров.

    Сделаю чтобы программа добавляла к уже считанному файлу новые сообщения и не надо будет считывать всё заново, если появились новые сообщения.

    Таким образом вы будете застрахованы от того, что, например, после полугодовой содержательной дискуссии не в "вашей теме", какая нибудь обиженная Jenlu сотрёт тему и все ваши сообщения на написание которых вы тратили усилия на сбор информации и тратили время исчезнут со всеми ссылками и цитатами.

    А тут у вас останется лента текста в стиле ascii и ссылки и цитаты будут сохранены. Имя файла - это "номер темы на форуме".txt

    Например, тема БЕЛОРУССИЯ имеет на форуме номер 2370. Значит сообщения из этой темы запомнятся в файле 2370.txt

    Вот только если я скопирую текст программы на форум - не исказится ли он движком форума? Посмотрю. Если не получится, надо придумать куда разместить текст.

    Продолжение следует...
    veresk нравится это.
  2. Оффлайн

    МАГА Гость

    На форуме с:
    Сообщения:
    0
    Симпатии:
    0
    Баллы:
    0
    круто.... по этим вещам как раз воваська со степанидой "спецы" по их же словам....
  3. Оффлайн

    big-bang Маршал

    На форуме с:
    07.04.2013
    Сообщения:
    116.399
    Симпатии:
    51.576
    Баллы:
    41
    Попробую выложить текст тут. Затем отсюда скопирую и посмотрю не исказился ли текст. Сообщу результат проверки (не сегодня)...
  4. Оффлайн

    big-bang Маршал

    На форуме с:
    07.04.2013
    Сообщения:
    116.399
    Симпатии:
    51.576
    Баллы:
    41
    Код:
    # sh readpage.bat
    
    #AUTHOR="big-bang"
    #AUTHOR="Коненосов"
    AUTHOR="Jenlu"
    
    temanamea="История идиотизма на ...."
    temaname="%D0%98%D1%81%D1%82%D0%BE%D1%80%D0%B8%D1%8F-%D0%B8%D0%B4%D0%B8%D0%BE%D1%82%D0%B8%D0%B7%D0%BC%D0%B0-%D0%BD%D0%B0-%E2%80%A6.2573"
    
    temanamenum=`echo "$temaname"|sed 's/.*\.//'`
    FILE="$temanamenum.txt"
    echo $FILE
    rm -f $FILE
    
    echo "$temaname">$FILE
    
    sp=1
    
    wget -q http://nastej.ru/threads/$temaname -O-|iconv -f utf8 -t iso5>page-1.txt
    pages=`cat page-1.txt|grep '<span class="pageNavHeader">'|head -1|sed 's%</span>%%;s/.*>//'`
    npages=`echo "$pages"|sed 's/.* //'`
    cat page-1.txt|grep "<h1>"|sed 's%</h1>%%;s%.*<h1>%%'|tee -a $FILE
    echo $pages|tee -a $FILE
    rm page-1.txt
    ep=$npages
    
    while getopts s:e: c
    do
        case $c in
        s) sp=$OPTARG;epage=$npages;;
        e) ep=$OPTARG;;
        esac
    done
    
    page=$sp;epage=$ep
    
    while [ $page -le $epage ]
    do
    
    echo "====== Page==$page ======">>$FILE
    
    wget -q http://nastej.ru/threads/$temaname/page-$page -Opage.utf8.html
    cat page.utf8.html|iconv -f utf8 -t iso5>page.iso.html
    
    cat page.iso.html|sed 's/[    ]*//;/^$/d'|tee page-2.txt|
    nawk "
    /^<li /&&/data-author=\"$AUTHOR\" /{pr=1;print;next}
    /^<\/li>/&&pr!=0{pr=0}
    pr==1{sub(/<br \/>/,\"\");print}
    ">page-1.txt
    
    cat page-1.txt| nawk '
    /<span class=\"DateTime\"/{sub(/.*title=\"/,"");sub(/".*/,"");print;print "===========================================";next}
    /<article>/{pr=1;next}
    /<\/article>/{pr=0;next}
    pr==1{print}
    '>>$FILE
    
    page=`expr $page + 1`
    
    if [ `expr $page % 100` -eq 1 ]
    then
        echo "*******pause*******"
        sleep 10
    fi
    
    done
    rm -f page.utf8.html page.iso.html page-1.txt page-2.txt 
    
  5. Оффлайн

    big-bang Маршал

    На форуме с:
    07.04.2013
    Сообщения:
    116.399
    Симпатии:
    51.576
    Баллы:
    41
    Кто-нибудь попробовал? Получилось?
  6. Оффлайн

    big-bang Маршал

    На форуме с:
    07.04.2013
    Сообщения:
    116.399
    Симпатии:
    51.576
    Баллы:
    41
    Кто-нибудь попробовал? Получилось?
  7. Оффлайн

    Чукча Абитуриент

    На форуме с:
    08.04.2013
    Сообщения:
    98.803
    Симпатии:
    30.261
    Баллы:
    41
    Предпочитаю пиво холодным

Поделиться этой страницей

Пользователи просматривающие тему (Пользователей: 0, Гостей: 0)