Википедия:Заявки на статус бота/Архив/2018
VolodimerBot
править- VolodimerBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: Vladimir Solovjev
- Цель
Замены с использованием AWB. Флаг нужен, чтобы не захламлять список наблюдения. В своё время флаг был, но потом сам же его снял по итогу этой заявки: у меня AWB на компьютере отказывалась работать, поэтому я решил, что смысла в флаге нет. Но сейчас я решил проблему, да и в последнее время иногда появляется необходимость осуществления замен.
- Технические подробности
Используется AWB
- Имеется флаг бота в других разделах Википедии?
Нет.
-- Vladimir Solovjev обс 10:32, 17 декабря 2018 (UTC)
Обсуждение (VolodimerBot)
правитьИтог
править- Флаг выдан (участник в течение долгого времени пользовался этим флагом и самостоятельно отказался от него в период неактивности бота). --Lev (обс.) 10:39, 17 декабря 2018 (UTC)
TBTBot
править- TBTBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: TenBaseT
- Цель
По пожеланиям коллег нужна запись бота, чтобы не засорять страницу свежих правок и не вызывать ложных срабатываний антивандальных ботов при исправлении ошибок статического анализатора. Работа планируется в ручном и в полуавтоматическом режиме.
- Технические подробности
автоматического режима не планируется
-- TenBaseT (обс.) 09:20, 3 декабря 2018 (UTC)
Обсуждение (TBTBot)
правитьКакими инструментами будут совершаться правки (AWB? свои скрипты?)(увидел) и какие именно ошибки планируется исправлять?
Про исправление тега<i>
: его бы сразу на''
менять. На страницах обсуждения пофиг, но если в статьях будет — то лучше так. ~Facenapalm 11:20, 3 декабря 2018 (UTC)- Примеры исправления ошибок можно посмотреть у меня во вкладе за последние несколько дней или во вкладе бота. Про тег «i» - согласен. TenBaseT (обс.) 11:25, 3 декабря 2018 (UTC)
- Я больше не о примерах спрашиваю, а о намерениях. Пока ты исправлял только отсутствующие закрывающие теги, как я понимаю. Какие-нибудь конкретные планы на остальное есть? ~Facenapalm 12:42, 3 декабря 2018 (UTC)
- Ну работы там ... отсюда и до пенсии :) Я пока точных планов не составлял, но пока в общих планах 240 страниц с несколькими незакрытыми тагами, 436 872 страниц с одним незакрытым тагом, 3230 страниц с фиктивными параметрами файлов ... ну и куча остальных проблем, которые я пока еще даже не смотрел. TenBaseT (обс.) 13:26, 3 декабря 2018 (UTC)
- Можно спросить, как AWB поможет в первых двух категориях? Там есть функция lintid, о которой я не знаю? Игорь (обс) 13:38, 3 декабря 2018 (UTC)
- Я планирую пока работать в ручном режиме, использовать AWB было советом на будущее, когда появятся для этого конкретные задачи. Так что по поводу AWB конкретных планов еще нет. TenBaseT (обс.) 13:43, 3 декабря 2018 (UTC)
- Фиктивные параметры файлов уже исправлялись (и до сих пор исправляются, я смотрю) ботом участника Vort. По-моему (я подробности уже призабыл), он не хотел пускаться на неэнциклопедические пространства имён, но у него есть готовый для этого код. Дабы не изобретать велосипед, лучше с ним обсудить фронт работ. ~Facenapalm 14:02, 3 декабря 2018 (UTC)
- Да, некоторые разновидности этих ошибок мой бот исправляет в автоматическом режиме (раз в сутки). Код находится вот тут. Модифицировать его для единоразовой зачистки других пространств имён должно быть несложно. Если надо будет, я расскажу как получить ключи доступа в нужном для бота формате. — Vort (обс.) 14:14, 3 декабря 2018 (UTC)
- Спасибо, обязательно обсудим, когда доберусь до них. TenBaseT (обс.) 14:21, 3 декабря 2018 (UTC)
- Да, некоторые разновидности этих ошибок мой бот исправляет в автоматическом режиме (раз в сутки). Код находится вот тут. Модифицировать его для единоразовой зачистки других пространств имён должно быть несложно. Если надо будет, я расскажу как получить ключи доступа в нужном для бота формате. — Vort (обс.) 14:14, 3 декабря 2018 (UTC)
- Можно спросить, как AWB поможет в первых двух категориях? Там есть функция lintid, о которой я не знаю? Игорь (обс) 13:38, 3 декабря 2018 (UTC)
- Ну работы там ... отсюда и до пенсии :) Я пока точных планов не составлял, но пока в общих планах 240 страниц с несколькими незакрытыми тагами, 436 872 страниц с одним незакрытым тагом, 3230 страниц с фиктивными параметрами файлов ... ну и куча остальных проблем, которые я пока еще даже не смотрел. TenBaseT (обс.) 13:26, 3 декабря 2018 (UTC)
- Я больше не о примерах спрашиваю, а о намерениях. Пока ты исправлял только отсутствующие закрывающие теги, как я понимаю. Какие-нибудь конкретные планы на остальное есть? ~Facenapalm 12:42, 3 декабря 2018 (UTC)
- Примеры исправления ошибок можно посмотреть у меня во вкладе за последние несколько дней или во вкладе бота. Про тег «i» - согласен. TenBaseT (обс.) 11:25, 3 декабря 2018 (UTC)
- Дело полезное, выделить такие вещи на ботоучетку в целом правильно. Еще можно попробовать en:WP:CLEANER, я, правда, сам не запускал, но, говорят, для такого рода задач удобен. Abiyoyo (обс.) 13:58, 3 декабря 2018 (UTC)
- Инициатива похвальная, проблем не вижу, За. Заглядывай ещё в Check Wikipedia. ~Facenapalm 14:03, 3 декабря 2018 (UTC)
- За, хотя я не вижу причин разделять вклад, если правки делаются вручную. — Алексей Копылов 07:27, 4 декабря 2018 (UTC)
- Причина тут — просьба. И нет причин её не удовлетворить, ведь всё-таки цель — улучшение Википедии, а не количество правок у основной учётной записи. — Vort (обс.) 10:37, 7 декабря 2018 (UTC)
Итог
править- Флаг присвоен. --Lev (обс.) 13:34, 10 декабря 2018 (UTC)
Well, Well, Bot!
править- Well, Well, Bot! (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: Участник:Well very well
- Цель
Бот меняет шаблон "нп5" на "не переведено 5" (уже не меняет), а также если ссылка переведена, меняет шаблон на ссылку. Примеры правок: [1], [2], [3], [4]. Правку на странице Дуговая диаграмма почему-то заблокировал фильтр. Почему?
- Технические подробности
Код на Python: https://github.com/LeviPesin/Interbot/blob/master/interbot.py, используется pywikibot.
-- Well very well (обс.) 07:21, 22 ноября 2018 (UTC)
Обсуждение (Well, Well, Bot!)
править- >Бот меняет шаблон "нп5" на "не переведено 5"
Зачем? Вот такие правки точно делать не надо, это бессмысленная накрутка. Отсилы одновременно с более существенными изменениями, но я не вижу пользы от таких правок в принципе.
>а также если ссылка переведена, меняет шаблон на ссылку
Смотря на наличие русской интервики у иноязычной статьи, а не существование статьи по русскоязычному названию? Это круто, это давно надо было сделать. По опыту могу только сказать, что надо как минимум игнорировать случаи, когда по иноязычной ссылке дизамбиг, потому что иногда наличие статьи означает не «статья переведена», а «статья переименована, а на месте неё оказалось что-то с интервикой». Плюс я давно собирался вычищать «не переведено», которые ссылаются на несуществующие в иноязычном разделе названия — возможно, это будет удобно реализовать в рамках твоего бота.
Ну и расшириться на нп1—нп4 было бы круто. А ещё вместо нп5 может быть {{iw}}, если что. ~Facenapalm 09:46, 22 ноября 2018 (UTC)- Хорошо, первое уберу. {{iw}} и {{НП5}} добавлю. Да, смотря на интервику. Про дизамбиг - не очень понятно, можете объяснить? Спасибо. Well very well (обс.) 10:35, 22 ноября 2018 (UTC)
- @Facenapalm: >Хорошо, первое уберу. {{iw}} и {{НП5}} добавлю.
Сделал, сейчас обновлю код на Гитхабе. Well very well (обс.) 11:05, 22 ноября 2018 (UTC)- Обновил. Well very well (обс.) 11:09, 22 ноября 2018 (UTC)
- Во всех языковых разделах есть Страницы значений. Иногда ссылка в «не переведено» ведёт на них. Возможно, этот случай надо особо обрабатывать.
Хотя, на самом деле, я сейчас подумал — пусть бот заменяет, ещё хуже не сделает, хоть внимание к проблеме привлечёт. ~Facenapalm 11:28, 22 ноября 2018 (UTC)
- @Facenapalm: >Хорошо, первое уберу. {{iw}} и {{НП5}} добавлю.
- Хорошо, первое уберу. {{iw}} и {{НП5}} добавлю. Да, смотря на интервику. Про дизамбиг - не очень понятно, можете объяснить? Спасибо. Well very well (обс.) 10:35, 22 ноября 2018 (UTC)
- Вопросы на понимание правил и отношения к ним:
1. Почему такие замены совершать не стоит?
2. Если в голову придёт новая идея для бота, что вы предпримете?
3. Если ваш бот из-за программной ошибки поломает большое количество статей, готовы ли взять ответственность за это и исправить их? ~Facenapalm 11:32, 22 ноября 2018 (UTC)- 1. Потому что это не необходимые действия, и может расцениваться как накрутка.
2. Подам другую заявку на статус бота.
3. Да. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)- 2. Не нужно подавать другую заявку, у нас не англовики. Просто если бот будет выполнять что-то, что хотя бы в теории может вызвать протесты, то по правилу ВП:МНОГОЕ нужно в начале обсудить и достичь консенсуса на эту работу.—Iluvatar обс 13:49, 22 ноября 2018 (UTC)
- Ясно, спасибо. Well very well (обс.) 13:59, 22 ноября 2018 (UTC)
- 1. Не «не необходимое», а просто ничего не меняющее по существу. Правка остаётся в истории изменений, всплывает в списках наблюдения… И при этом не факт, что делает лучше. Вдруг завтра появится ботовод, которому «нп5» нравится больше, чем «не переведено 5»? Не менять же туда-сюда. Иногда такие мелкие замены нужны (например, перенаправление удалено), но это должно быть заранее оговорено.
Обычно такие замены если и делаются, то только фоном — заодно с более существенными правками.
2. На самом деле, такое даже не практикуется. Достаточно оценить консенсусность, и, если консенсус не очевиден, обсудить проход на форуме предложений, или даже на общем форуме. Если речь идёт об исправлении очевидной ошибки или переименовании категории, по которому уже подведён итог, можно даже ничего не обсуждать.
См. ВП:МНОГОЕ. ~Facenapalm 13:49, 22 ноября 2018 (UTC)- Ясно, спасибо. Well very well (обс.) 13:59, 22 ноября 2018 (UTC)
- 2. Не нужно подавать другую заявку, у нас не англовики. Просто если бот будет выполнять что-то, что хотя бы в теории может вызвать протесты, то по правилу ВП:МНОГОЕ нужно в начале обсудить и достичь консенсуса на эту работу.—Iluvatar обс 13:49, 22 ноября 2018 (UTC)
- 1. Потому что это не необходимые действия, и может расцениваться как накрутка.
- Вопросы и предложения к реализации:
1. Шаблонов вида «не переведено» пять штук, кроме «нп5» есть с аналогичным синтаксисом {{нп2}}, {{нп3}}, {{нп4}}, {{нп5}} (с {{не переведено}} сложнее, у него может быть другой синтаксис). Кроме того, первая буква нечувствительна к регистру: можно писать {{не переведено 5}}, можно {{Не переведено 5}}, будет работать. Чтобы охватить всё, лучше воспользоваться регулярным выражением (справка для питона).
2. Часть параметров можно опустить. Если отсутствует третий параметр, в него подставляетсяen
, если второй и четвёртый — в них подставляется первый. Синтаксис MediaWiki позволяет писать, например, так:{{нп5|Статья|4=Article}}
, что раскрывается в{{нп5|Статья|||Article}}
и по смыслу значит{{нп5|Статья|Статья|en|Article}}
. Я вижу, в коде это частично учтено, но лишь частично. Есть библиотека mwparserfromhell, которая может помочь с обработкой всех частных случаев.
3. Как я уже говорил, четвёртый параметр может вести на несуществующую статью, вот так[англ.]. Их хорошо бы удалять.
Разумеется, это не критика бота, скорее предложение к дальнейшему развитию. ~Facenapalm 11:40, 22 ноября 2018 (UTC)- 2. Да, я знаю это, и учел в своем коде.
3. Сделаю (завтра-послезавтра), спасибо. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)- 3. Сделал, сейчас ещё раз протестирую бота. Well very well (обс.) 14:52, 22 ноября 2018 (UTC)
- Работает. Well very well (обс.) 15:12, 22 ноября 2018 (UTC)
- 3. Сделал, сейчас ещё раз протестирую бота. Well very well (обс.) 14:52, 22 ноября 2018 (UTC)
- 1. Да, желательно это сделать, чтобы не получался несправедливый перекос в сторону одного из вариантов. С {{нп2}} ещё нужно быть осторожным в том, что там нужно сохранять и «англ. что-то там», и параметр «текст» после него (см. как работает subst:нп2 в таких случаях). Викизавр (обс.) 16:24, 22 ноября 2018 (UTC)
- 1. Добавил нп4 (с его вариациями). Остальные имеют другой синтаксис.
2. Сделал.
Код на Гитхабе изменю после всех его правок и теста. Well very well (обс.) 10:51, 29 ноября 2018 (UTC)- >Остальные имеют другой синтаксис
У нп3 точно тот же. ~Facenapalm 11:56, 29 ноября 2018 (UTC)- Там пустые параметры могут быть без |. Well very well (обс.) 12:12, 29 ноября 2018 (UTC)
- (ответ на первую версию сообщения) Какие? 4 неименованных параметров и nocat. Остальные в коде шаблона не поддерживаются, так что если ты их уберёшь, ты ничего не сломаешь. Нп5 поддерживет то же и ещё больше.
(ответ на текущую) Пустые параметры могут быть в любых шаблонах. ~Facenapalm 12:16, 29 ноября 2018 (UTC)- Но в обычных шаблонах - abc|def|||. А тут может быть просто abc|def. Well very well (обс.) 12:30, 29 ноября 2018 (UTC)
- Во всех шаблонах так. Может быть
{{нп5|Article|Статья||}}
, может быть{{нп5|Article|Статья}}
. Может быть{{нп5|Статья|||Article}}
, может быть{{нп5|Статья|4=Article}}
. С точки зрения вики-разметки и механизма шаблонов эти примеры попарно эквивалентны. Ничего того, что умеет нп3 и не умеет нп5 нет, я посмотрел в код шаблона. Пожалуйста, убедитесь, что вы понимаете синтаксис MediaWiki и что ваш бот ничего не сломает до того, как вы его запустите. ~Facenapalm 14:17, 29 ноября 2018 (UTC)- Хорошо, я понял, спасибо. Well very well (обс.) 15:46, 29 ноября 2018 (UTC)
- В данный момент код поддерживает следующие вариации (проверяется название, переведённое в нижний регистр): не переведено 5, нп5, iw, нп4, ut4, не переведено 4, не переведено 3, нп3. Well very well (обс.) 10:50, 30 ноября 2018 (UTC)
- Хорошо, я понял, спасибо. Well very well (обс.) 15:46, 29 ноября 2018 (UTC)
- Во всех шаблонах так. Может быть
- Но в обычных шаблонах - abc|def|||. А тут может быть просто abc|def. Well very well (обс.) 12:30, 29 ноября 2018 (UTC)
- (ответ на первую версию сообщения) Какие? 4 неименованных параметров и nocat. Остальные в коде шаблона не поддерживаются, так что если ты их уберёшь, ты ничего не сломаешь. Нп5 поддерживет то же и ещё больше.
- Там пустые параметры могут быть без |. Well very well (обс.) 12:12, 29 ноября 2018 (UTC)
- 2. Тут есть одна проблема: mwparserfromhell не поддерживает переделывание шаблона в строку, когда в шаблоне содержатся символы не из ASCII (к примеру, русские буквы). Well very well (обс.) 12:12, 29 ноября 2018 (UTC)
- @Facenapalm: Ну так что тут делать? Well very well (обс.) 10:41, 30 ноября 2018 (UTC)
- Никаких проблем с этим я у себя не помню, а гадать на кофейной гуще не хочу. ~Facenapalm 11:19, 30 ноября 2018 (UTC)
- @Facenapalm: Ну так что тут делать? Well very well (обс.) 10:41, 30 ноября 2018 (UTC)
- >Остальные имеют другой синтаксис
- 2. Да, я знаю это, и учел в своем коде.
- Какой-то у вас страшный метод парсинга страницы, проще сделать чем-то вродеА идея хорошая! Викизавр (обс.) 12:01, 22 ноября 2018 (UTC)
import re regex = re.compile(r'(\{\{\s*(?:[Нн]п[2-5]|[Нн]е переведено [2-5]|[Ii]w)\s*\|([^\{\}]*)\}\})') #\}\} def processIW(match): fullTemplate = match.group(1) raw_params = match.group(2).split('|') params = raw_params # учесть = if False: # существует страница к params[0] return # изменённый вариант else: return '((' + fullTemplate + '))' # скобки для тестирования page = 'Нужно {{iw|Smth|Что-то||Чего-то}} и ещё {{нп3|Qch|что-то|fr|}}, а также {{Нп|1=Smth|4=чего-то}}' result = regex.sub(processIW, page) print(result)
- Я не очень знаю эти рег. выражения. Мне проще как у меня. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)
- Угу, потому я регулярку и написал сам — чтобы её можно было использовать как чёрный ящик. Викизавр (обс.) 14:00, 22 ноября 2018 (UTC)
- Спасибо! Well very well (обс.) 14:35, 22 ноября 2018 (UTC)
- Угу, потому я регулярку и написал сам — чтобы её можно было использовать как чёрный ящик. Викизавр (обс.) 14:00, 22 ноября 2018 (UTC)
- Я решил все же сделать через mwparserfromhell. Извините. Well very well (обс.) 10:51, 29 ноября 2018 (UTC)
- Я не очень знаю эти рег. выражения. Мне проще как у меня. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)
- Давно пора было кому-то этим заняться. Если замен редиректов не будет (нп5 на не переведено 5) и не будет попыток замены одного шаблона другим (на3 на нп5, например), то однозначно флаг нужно выдавать. А ссылки на дизамбиги можно кидать в отчёт и разгребать вручную.—Iluvatar обс 12:15, 22 ноября 2018 (UTC)
- Замен редиректов не будет. Попыток замены не будет (пока, кстати нп меньшие 5 не обрабатываются вообще, сделаю потом). В отчет (на странице в моем подпространстве) сделаю завтра-послезавтра. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)
- Про дизамбиги сделал. Well very well (обс.) 12:10, 29 ноября 2018 (UTC)
- Замен редиректов не будет. Попыток замены не будет (пока, кстати нп меньшие 5 не обрабатываются вообще, сделаю потом). В отчет (на странице в моем подпространстве) сделаю завтра-послезавтра. Well very well (обс.) 13:32, 22 ноября 2018 (UTC)
- За ~Facenapalm 13:49, 22 ноября 2018 (UTC)
- Я правильно понимаю, что бот бесконечно высасывает содержимое всех страниц проекта с лайва? Может лучше юзать дамп для этих запросов?—Iluvatar обс 14:06, 22 ноября 2018 (UTC)
- Да, правильно понимаете. Дамп - то есть хранить точку остановки? Или что-то другое? Well very well (обс.) 14:35, 22 ноября 2018 (UTC)
- Игорь (обс) 14:38, 22 ноября 2018 (UTC)
- Ну скорее всего имелась ввиду какая-то ссылка со всеми статьями. Но чем тогда pagegenerators хуже? Well very well (обс.) 14:52, 22 ноября 2018 (UTC)
- Игорь (обс) 14:55, 22 ноября 2018 (UTC)
- На всякий случай: посмотрите последний абзац ВП:ППБ#Требования к ботам. Дамп — это копия всех страниц рувики, заранее скачанная на ваш компьютер, чтобы не грузить их по отдельности. Викизавр (обс.) 14:56, 22 ноября 2018 (UTC)
- Это архивная копия всех статей проекта. Юзать запросы к АПИ для бесконечного чтения 1,5 млн статей крайне не рекомендуется, о чём сказано во всевозможных правилах использования ботов. Хуже подобный подход тем, что вы создаёте перманентную нагрузку на лайв-сервера, тогда как её вполне можно избежать. См сначала это, потом это. Локально работать с дампом очень приятно, 4 строчки кода. На Лабсе не юзал, но наверняка нет сложностей и там.—Iluvatar обс 14:59, 22 ноября 2018 (UTC)
- Угу, то есть в дампе куча файлов xml. И как их привести к тому виду, который посылается на вход моей функции? Well very well (обс.) 15:07, 22 ноября 2018 (UTC)
- XML-файл с последними версиями текста всех страниц рувики один - вот https://dumps.wikimedia.org/ruwiki/20181101 /ruwiki-20181101-pages-meta-current.xml.bz2 например последний, новые выходят примерно третьего и двадцать третьего числа каждого месяца. Там архив 4 ГБ, распаковывается в хмл 25 ГБ, полученный хмл можно парсить любым способом, он содержит исходный текст каждой страницы. Кроме того, для подготовки списка страниц для работы можно использовать служебные страницы типа "список страниц, включающих этот шаблон", собирать машиночитаемые списки с таких страниц помогают инструменты ВП:АВБ и ВП:PetScan. MBH 15:23, 22 ноября 2018 (UTC)
- Распаковывать ничего не нужно для простого перебора статей. Локально вот так работать. Быстро и просто. На Лабсе сказать не могу. В крайнем случае прогуляйтесь по чужим каталогам или спросите в чате/форуме/юзеров.—Iluvatar обс 15:30, 22 ноября 2018 (UTC)
- Спасибо! Лабс - это Toolforge? Well very well (обс.) 16:15, 22 ноября 2018 (UTC)
- Да. (комментарий к правке) Качать не нужно, они уже там. Если только на комп чтобы понято как с ними работать вообще, потестить.—Iluvatar обс 16:18, 22 ноября 2018 (UTC)
Там есть проблема. Спрошу на форуме.А, нет, кажется нет. Проверю через несколько часов. Well very well (обс.) 04:06, 23 ноября 2018 (UTC)- Проблемы нет. Well very well (обс.) 14:30, 24 ноября 2018 (UTC)
- Да. (комментарий к правке) Качать не нужно, они уже там. Если только на комп чтобы понято как с ними работать вообще, потестить.—Iluvatar обс 16:18, 22 ноября 2018 (UTC)
- Спасибо! Лабс - это Toolforge? Well very well (обс.) 16:15, 22 ноября 2018 (UTC)
- Угу, то есть в дампе куча файлов xml. И как их привести к тому виду, который посылается на вход моей функции? Well very well (обс.) 15:07, 22 ноября 2018 (UTC)
- Ну скорее всего имелась ввиду какая-то ссылка со всеми статьями. Но чем тогда pagegenerators хуже? Well very well (обс.) 14:52, 22 ноября 2018 (UTC)
- Игорь (обс) 14:38, 22 ноября 2018 (UTC)
- Да, правильно понимаете. Дамп - то есть хранить точку остановки? Или что-то другое? Well very well (обс.) 14:35, 22 ноября 2018 (UTC)
- За — Джек (обс.) 15:28, 22 ноября 2018 (UTC)
- Вот еще какая идея появилась. Если есть красная ссылка, то пытаться перевести с помощью какого-нибудь переводчика, и искать такое название в другой Википедии, и если нашлось, то писать в отчет с предложением поставить шаблон. Well very well (обс.) 04:17, 23 ноября 2018 (UTC)
- Может для начала просто искать если в квадратных скобках — что-то написанное латиницей. be-nt-all (обс.) 05:11, 23 ноября 2018 (UTC)
- Нет, зачем? Если, к примеру, будет [[Windows 10]]? Well very well (обс.) 09:43, 23 ноября 2018 (UTC)?
- Если вы готовы сами разгребать эти отчёты — флаг в руки. Если вы уверены, что в каких-то случаях шаблоны может проставить бот — обсудите это на форуме и дерзайте. В противном случае не вижу смысла. У нас 69 тысяч статей имеют прямые ссылки на другие разделы (
[[:en:Article|такие]]
), которые надо заменить на внутренние и шаблоны «не переведено», потому что мешают, а рук нет (ботом это делать нельзя, если вдруг что). Боюсь, за ваши отчёты тем более никто браться не будет. ~Facenapalm 11:35, 23 ноября 2018 (UTC)- Ну буду стараться разгребать. Well very well (обс.) 12:45, 23 ноября 2018 (UTC)
- Может для начала просто искать если в квадратных скобках — что-то написанное латиницей. be-nt-all (обс.) 05:11, 23 ноября 2018 (UTC)
- Генератор можно (нужно) заменить с рекурсивного поиска по категории на включения шаблона нп5 в ОП. Документация — [5]. Либо использовать дамп.
articles = pywikibot.Page(mysite, "Не переведено 5", ns=10).getReferences( namespaces=0, only_template_inclusion=True)
И реализовать поиск интервик можно стандартными средствами, хотя не факт оно будет лучше/быстрее и т.д. — d:Wikidata:Creating a bot/ru#Пример № 2: получение интервики-ссылок. -- dima_st_bk 05:06, 24 ноября 2018 (UTC)- Спасибо! Но наверно, лучше попробую разобраться с дампом. Well very well (обс.) 06:16, 24 ноября 2018 (UTC)
- Был очень занят вчера и сегодня, поэтому мало сделал. Завтра постараюсь сделать много. Well very well (обс.) 14:30, 24 ноября 2018 (UTC)
- За — Алексей Копылов 01:26, 1 декабря 2018 (UTC)
- За, полезное дело, см. Википедия:Запросы к ботоводам#Переведенные «не переведено»--Komap (обс.) 11:24, 29 декабря 2018 (UTC)
Предварительный итог
правитьБюрократы рассмотрели заявку. И, по нашему мнению, если вы исправите бот таким образом, чтобы он делал запросы к дампу базы (см. ВП:ДАМП), то флаг может быть присвоен.-- Vladimir Solovjev обс 13:42, 11 декабря 2018 (UTC)
- Для этого мне нужно, чтобы мне помогли исправить одну ошибку. Напишу участок кода с нею. Well very well (обс.) 14:21, 15 декабря 2018 (UTC)
- @Well very well: — что-то получилось с исправлением кода? Или может пока закроем заявку, чтобы не висела здесь в открытом виде?-- Vladimir Solovjev обс 17:24, 19 февраля 2019 (UTC)
- Как мне кажется, лучше пока закрыть, но разархивировать мою последнюю тему в форуме ботоводов. Well very well (обс.) 02:34, 20 февраля 2019 (UTC)
- @Well very well: — что-то получилось с исправлением кода? Или может пока закроем заявку, чтобы не висела здесь в открытом виде?-- Vladimir Solovjev обс 17:24, 19 февраля 2019 (UTC)
Итог
правитьЗаявка закрыта, когда будете готовы, создавайте новую, сославшись на эту. Тему на форуме бототоводов из архива можете перенести сами, это нормальная практика.-- Vladimir Solovjev обс 15:58, 20 февраля 2019 (UTC)
Well very well, Vladimir Solovjev, Iluvatar, мне кажется, что выдвинутое в обсуждении заявки требование "использовать дамп" ошибочно в случае данного бота. Вместо этого достаточно настроить его так, чтобы он работал не непрерывно циклически, а, скажем, запускался один раз в месяц, проходя все статьи с шаблоном один раз (список статей с шаблоном можно получить многими способами). Во-первых, никакой заметной нагрузки на сервера такой бот, читающий статьи наживую, создавать не будет (чтения живых читателей создают неизмеримо бОльшую нагрузку, а получение данных из апи оптимизировано и создаёт меньшую нагрузку на сервера, чем чтение статьи в браузере). Читать нужно не все статьи подряд, ища там шаблон нп5, а только статьи с шаблоном нп5, список которых можно получить, например, из апи. Но чтобы сделать правку в статье, боту в любом случае придётся загрузить её текущую версию, версия из дампа не подойдёт, потому что она будет устаревшей на срок до 20-ти дней. Итого, на мой взгляд, требовать непременно использовать дамп не нужно, вместо этого достаточно лимитировать частоту запусков бота одним проходом в месяц или в неделю. MBH 14:53, 21 февраля 2019 (UTC)
- Пожалуйста, пусть делает так. Но сначала сделает, а потом подаёт новую заявку.-- Vladimir Solovjev обс 14:57, 21 февраля 2019 (UTC)
- Я предлагаю, чтобы бот проверял, имеет ли неправильный шаблон статья в дампе, и если да, то потом уже проверял, есть ли в текущей версии. Well very well (обс.) 15:08, 21 февраля 2019 (UTC)
Texvc2LaTeXBot
править- Texvc2LaTeXBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод/Botmaster: User:Debenben (together with User:Salix_alba, responsible for English speaking projects)
- Цель/Purpose
Replacing depricated math syntax.
- Технические подробности/Technical details
Pywikibot sourcecode
See w:en:WP:Bots/Requests_for_approval/Texvc2LaTeXBot, phab:T197925, mw:Extension:Math/Roadmap and phab:T195861 for a more detailed description of the bot and the associated migration project. My Russian skills are limited (I can say hello and guess the meaning of about half the words and sentences here), so it would be nice if we could get some help in translating the edit summary and userpage. Also feel free to join our commission to discuss the proposed improvements to the math extension.
- Имеется флаг бота в других разделах Википедии?/Already has a bot flag in other wikipedias?
The bot was granted a botflag on dewiki, frwiki, eswiki and approved for operation without botflag on itwiki. The request for botflag on enwiki is still in progress: w:en:Wikipedia:Bots/Requests_for_approval/Texvc2LaTeXBot, other projects will follow.
-- Debenben (обс.) 14:34, 3 октября 2018 (UTC)
Обсуждение/Discussion (Texvc2LaTeXBot)
править- За/Support/Pro We need such bot. I would be happy to help you with translations. — Алексей Копылов 02:32, 5 октября 2018 (UTC)
- Great, feel free to create a userpage. What about
- Бот: заменить устаревший математический синтаксис в соответствии с mw:Extension:Math/Roadmap
- as editsummary?--Debenben (обс.) 17:38, 7 октября 2018 (UTC)
- Бот: замена устаревшего математического синтаксиса в соответствии с mw:Extension:Math/Roadmap ~Facenapalm 17:41, 7 октября 2018 (UTC)
- Большое спасибо--Debenben (обс.) 16:48, 22 октября 2018 (UTC)
- Great, feel free to create a userpage. What about
Итог
правитьСделано. В общем, каких-то противопоказаний не увидел, так что флаг присвоен.-- Vladimir Solovjev обс 12:43, 22 ноября 2018 (UTC)
WikisaurusBot
править- WikisaurusBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: Wikisaurus
- Цель
Запрашиваю флаг для выполнения простых запросов на ВП:РДБ, поскольку там часто завалы. Примеры выполненных запросов (на AWB, пока что через основную учётку):
- ВП:РДБ#Ссылки на шаблоны (см. там использованные регулярки): простановка навшаблона, правки
- ВП:РДБ#Категория:Сезоны Кубка обладателей кубков УЕФА: простановка навшаблона, правки
- ВП:РДБ#Вычистить шаблоны: удаление навшаблона, правки
- ВП:РДБ#Вычистить ссылки на mosritual.ru (см. там использованные регулярки): удаление ссылок на сайт, правки
- ВП:РДБ#Шаблон:H без третьего параметра (см. там использованные регулярки): исправление включений шаблона, правки (немного тестовых, все 850 — только с флагом бота, разумеется)
- Технические подробности
AWB (сейчас вручную, с флагом бота — в боторежиме, но частично и вручную, пока проверяю работу)
- Имеется флаг бота в других разделах Википедии?
Нет
-- Викизавр (обс.) 14:08, 23 сентября 2018 (UTC)
Обсуждение (WikisaurusBot)
править- За. С участником общаюсь давно, техническая грамотность на уровне, готовность взять ответственность за свои действия есть. «Универсальных» ботоводов у нас критически не хватает, в перспективе одного-двух лет ВП:РДБ на постоянной основе обслуживало всего два ботовода, не считая заглядывавших раз в полгода на один-два запроса, причём я сейчас в вики-отпуске, а Макс редко берётся за запросы, лежащие за рамками возможностей AWB. Помощник был бы очень кстати. А если этот помощник ещё и будет готов в случае необходимости руками просматривать сотни правок, его помощь будет незаменимой.
И на этой почве вопрос к кандидату — а за рамки AWB выходить планируешь? Я надеялся, что ты своё знание питона пристроишь. Готов помочь разобраться, если нужно будет. ~Facenapalm 20:32, 23 сентября 2018 (UTC) - За Посмотрел сделанные правки - качественная работа. Да и общее впечатление от участника - только положительное. — Алексей Копылов 00:19, 24 сентября 2018 (UTC)
- За. Как минимум, мой запрос качественно выполнил. Oleg3280 (обс.) 17:28, 24 сентября 2018 (UTC)
- За, проблем не вижу. MBH 09:59, 27 сентября 2018 (UTC)
Итог
правитьКонсенсус очевиден, флаг присвоен. И внёс в Википедия:AutoWikiBrowser/CheckPage.--Vladimir Solovjev обс 10:59, 29 сентября 2018 (UTC)
evsBot
править- evsBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: evs
- Цель
Прошу присвоить мне статус бота для массовых правок с помощью AWB, примеры правок: [6], [7], [8]. Будет работать в полуручном режиме. Готов нести ответственность за все совершённые ботом правки. В случае присвоения указанной УЗ флага бота, прошу внести её в Википедия:AutoWikiBrowser/CheckPage
- Технические подробности
Будет работать на AWB
- Имеется флаг бота в других разделах Википедии?
Нет
-- evs 💬 06:58, 29 июля 2018 (UTC)
Обсуждение (evsBot)
править- Очень бы хотелось услышать пояснения «ответственного» ботовода по поводу вот этой его недавней правки. --79.164.158.134 17:37, 31 июля 2018 (UTC)
- Не имеет никакого отношения к боту. Посторонние вопросы к участнику задаются на его странице обсуждения.—Iluvatar обс 18:21, 31 июля 2018 (UTC)
- ПКК вообще АИ? Как там по ней измеряют длину береговой линии? И разве на ней есть координаты в wgs84? Дату доступа меняете - вы открываете каждую замененную ссылку? Дата доступа, это подтверждение того, что информация на тот момент там была. -- dima_st_bk 04:39, 1 августа 2018 (UTC)
- Ну а почему же не АИ? Именно там официальные границы водных объектов записаны. Измерить можно как грубо (линейкой), так и нормально, подключив с помощью WMS слой подложки и сопутствующие слои данных в ArcGIS. Проекция там используется EPSG:4326, что является аналогом WGS84. Заменённые ссылки да, специально смотрел, чтобы были актуальны и указывали на описываемый в статье объект. — evs 💬 16:32, 1 августа 2018 (UTC)
- 2.3.8. Арбитражный комитет отмечает, что использование карт должно быть ограниченным, результаты нетривиальных вычислений по карте, требующих определённых навыков (самостоятельное вычисление площади, обмер протяжённых объектов и т. п.), будут оригинальным исследованием, поэтому должны быть исключены из статей. АК:898. Осторожнее с этим, я сейчас по ПКК перемерил озеро Чагытай и у меня площадь и длина линии не сошлись, при том на относительно много (0,5 км2 и 1,2 км). -- dima_st_bk 22:51, 1 августа 2018 (UTC)
- К сожалению, у меня больше нет доступа к ArcGIS чтобы подтвердить или опровергнуть точность вычисления площади, поэтому ничего не могу сказать на этот счёт. Вы через инструмент Calculate Geometry проверяли? Впрочем, я в общем-то и не собирался добавлять повсеместно ссылки на ПКК в качестве АИ, мои правки способствовали лишь актуализации самих ссылок, так как ранее представленные в статье были «мёртвыми». Насчёт точности вычисления площадей, да и вообще правильности применения карт для получения данных в статьях, думаю в этой заявке это уже оффтопик. Если хотите, можем продолжить это обсуждение в более подходящем месте, можно даже в #pro-geo. — evs 💬 04:29, 2 августа 2018 (UTC)
- 2.3.8. Арбитражный комитет отмечает, что использование карт должно быть ограниченным, результаты нетривиальных вычислений по карте, требующих определённых навыков (самостоятельное вычисление площади, обмер протяжённых объектов и т. п.), будут оригинальным исследованием, поэтому должны быть исключены из статей. АК:898. Осторожнее с этим, я сейчас по ПКК перемерил озеро Чагытай и у меня площадь и длина линии не сошлись, при том на относительно много (0,5 км2 и 1,2 км). -- dima_st_bk 22:51, 1 августа 2018 (UTC)
- Ну а почему же не АИ? Именно там официальные границы водных объектов записаны. Измерить можно как грубо (линейкой), так и нормально, подключив с помощью WMS слой подложки и сопутствующие слои данных в ArcGIS. Проекция там используется EPSG:4326, что является аналогом WGS84. Заменённые ссылки да, специально смотрел, чтобы были актуальны и указывали на описываемый в статье объект. — evs 💬 16:32, 1 августа 2018 (UTC)
- Вопрос: если вы будете работать в полуручном режиме, то зачем нужен флаг бота? Кроме того, вы в курсе, что прежде чем делать массовые правки, нужно убедиться в их консесусности?--Vladimir Solovjev обс 18:45, 25 августа 2018 (UTC)
Итог
правитьВ общем, ответа я так и не дождался, похоже, что интерес к заявке потерян. Так что флаг не присвоен.-- Vladimir Solovjev обс 12:41, 22 ноября 2018 (UTC)
DreikhemBot
править- DreikhemBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: Участник:Dreikhem
- Цель
Бот будет использоваться для выполнения заданий на ВП:РДБ, а также для разрешения неоднозначностей. Пример выполненного задания - заполнение таблицы длинами рек и площадями озёр из карточек статей из Казахской вики на Проект:Водные объекты/К созданию/Казахстан. Сразу хочу оговорится насчёт начальных правок задания и вылетов авторизации в начале задания - да, мне следовало в начале протестировать программу в пространстве пользователя, но мне она показалась лёгкой, поэтому я не стал этого делать - я учту этот опыт, и в следующий раз буду стараться проводить тестирование в юзерспейсе до первой боевой правки. Ошибки были чистой невнимательностью: разлогин произошёл из-за того, что я просто забыл добавить вызов метода логина, таблицы съезжали потому, что я опечатался в коде их формирования.
Также исправил некоторые ссылки на страницу неоднозначности Google.
Я открыт для предложений, не против работы, для которой ещё не создано готовых инструментов (имею некоторый опыт в программировании, могу попытаться создать).
Работать будет пока что в полуручном режиме.
- Технические подробности
Для исправления ссылок на неоднозначности использовал соответствующий скрипт из pywikipedia framework (зачем изобретать велосипед?), для заданий планирую использовать фреймворк Wiki.java, в частности он был использован для первого задания.
Код программы, написанной для выполнения задания.
- Имеется флаг бота в других разделах Википедии?
нет
-- Дрейкхем Обс. 22:21, 17 марта 2018 (UTC)
Обсуждение (DreikhemBot)
правитьДолго уже висит заявка, никто не прокомментировал--Дрейкхем Обс. 20:28, 30 марта 2018 (UTC)
- У нас возникли некоторые сомнения. Главное - для любого бота должен быть чётко прописан базовый функционал, а фраза, что «Бот будет использоваться для выполнения заданий на ВП:РДБ, а также для разрешения неоднозначностей» очень неконкретная. При этом даже выполненное задание вызвало некоторые проблемы. Всё же наличие флага бота предполагает определённый уровень ответственности, здесь недопустима невнимательность. Второй вопрос - я обратил внимание, что вы не очень активны в Википедии, действительно ли вам это нужно?--Vladimir Solovjev обс 16:51, 10 апреля 2018 (UTC)
- Что касается первого замечания - я понимаю уровень ответственности. Да, в задании были погрешности, но это было первое задание, проба пера. Естественно, что в задании с массовыми правками, тем более в статьях, предварительная выверка обязательно. Что касается неконкретности описания. В Википедии, насколько я понял, ботоводов лишних не бывает - ботоработы востребованы, с другой же стороны - не совсем понятно, каких именно ботов не хватает, ведь вроде боты есть для всего. Было бы неплохо, если б востребованные ботоработы были где-то явно перечислены - да, есть форум ботоводов и другие форумы, но информации такой маловато и она очень рассеяна.
- А вот касательно малой активности в Википедии - да, это веское замечание, правлю я действительно лишь изредка, когда приходит вдохновение. Сейчас, после нескольких недель, я думаю, что да, видимо эта заявка не нужна.--Дрейкхем Обс. 19:55, 11 апреля 2018 (UTC)
Итог
правитьПоскольку участник указывает, что теперь сомневается в необходимости заявки, то закрываю её, флаг бота не присвоен.--Vladimir Solovjev обс 19:07, 4 июля 2018 (UTC)
CopyvioCheckerBot
править- CopyvioCheckerBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: OlegCinema, Vladis13
- Цель
Бот будет работать в автоматическом режиме. Его задача: находить нарушение авторских прав в новых статьях. Бот успешно продемонстрирован и в данный момент спокойной работает Участник:CopyvioCheckerBot/Список, [9], Обсуждение:The birds трибьют группа, [10].
- Технические подробности
- Исходный код написан на языке Python, хостится на tools.wmflabs.org. Имеется открытый лог здесь.
- Проверяет список новых статей каждые 10 минут. Проверяются только первые правки новых страниц, поскольку статьи Википедии очень быстро репостятся по интернету, в частности на сайты-зеркала. Так мы избавляемся от ложных срабатываний из-за сравнения статей с их же репостами.
- Статьи с подозрениями на КОПИВИО бот вносит в таблицу ВП:ПСАП. Обсуждается добавление ссылки на этот список на ВП:ПАТ, ВП:ЗПАТ/ВП:ЗКПАУ, ВП:Ф-АП, где участники заинтересованны в таком инструменте.
- Используется сервис проверки https://tools.wmflabs.org/copyvios. Он был сделан для бота EarwigBot, но тот для проверки использует англ. поисковик Yahoo!, запросы к которому оплачены WMF.
- Создание более массовых проверок пока не планируется. Ибо сервис проверки использует Google, у которого бесплатный лимит ~1000 запросов за сутки. В среднем по воскресеньям в ВП создается не больше 300 статей, в другие дни меньше. Бот исключает статьи не нуждающиеся в проверке, на данный момент это неоднозначности. (Возможно стоит добавить фильтры по размеру статей, и с шаблонами, когда текст добавлен из свободных источников.)
- В сервисе проверки имеется белый список сайтов (игнорлист), также учитываются игнорлисты en:Wikipedia:Mirrors and forks и meta:User:EranBot/Copyright/Blacklist. Можно сделать дополнительный список.
- В ранней версии бота отправлялись предупреждения на СО статей, с возможностью указать там же статус проверки. Функция отключена ввиду отсутствия консенсуса в этой заявке.
- Имеется флаг бота в других разделах Википедии?
OlegCinema — не имеется. Vladis13 — в ВП и Викитеке.
-- OlegCinema (обс.) 23:47, 14 февраля 2018 (UTC)
Обсуждение (CopyvioCheckerBot)
править"Если промахом не будет и ложных срабатываний, можно помещает шаблон copyvio в саму статью." Распишите это утверждение по-подробнее, пожалуйста - непонятно: бот сам шаблон будет ставить? Если да - этап тестирования уже завершён?--Saramag (обс.) 04:13, 15 февраля 2018 (UTC)
Я в личной переписке от коллеги получил такой ответ:
Приветствую, коллега. Переформулирую: когда в будущем бот не будет допускать ошибок в плане ложных срабатываний (увелечение или уменьшение % соотношения), при достижении консенсуса планирую сделать так, чтобы бот отправлял уведомление о копивио не только на страницу обсуждения статьи, но и шаблоном {{copyvio}} на саму статью, с автоматическим указанием сайта. У:OlegCinema
- Против присвоения флага, пока бот размещает на СО статей шаблоны (про их внешний вид и формулировки я уж вообще молчу). Этот сервис порой работает весьма странно, определяет будто бы копивио англоязычных источников и прочее. А ещё бывают микро-стабы из одной строки, которая не охраняатся как тривиальная.--Iluvatar обс 10:18, 15 февраля 2018 (UTC)
- А что плохого собственно в размещение на СО статей шаблонов? Бот показал безупречный результат. За всё время работы с сервисом не увидел никаких ложных срабатываний. Бот уведомляет о копивио только при 60% — а при таком проценте, на секундочку, сомневаюсь в ложном срабатывании. В обсуждении речь шла про 17% (или чуть более). За время работы бота было удалено уже несколько страниц по О11. Да и тривиальных данных недостаточно для создания статьи, поэтому всё равно её нести на удаление. А за вчерашний день бот проверил более 30 новых страниц, и не одного ложного реагирования. Те, где было копивио — либо вырезано, либо удалены, либо ждут удаления. --OlegCinema (обс.) 10:39, 15 февраля 2018 (UTC)
- 1. Я написал статью Экспедиция Франклина (1845—1847). В ней процент возможного копивио аж 72.1%. На страницу обсуждения статьи прилетает шаблон в два экрана с заявлением, будто бы моя статья должна быть «срочно выставлена на быстрое удаление» (!). Я кручу пальцем у виска, обижаюсь и ухожу из проекта. Как вы собираетесь предотвращать подобные ситуации?
- 2. Понимаете ли вы, что заимствование -- это не всегда копивио? Что бывает тривиальный текст, бывает текст в ОД, бывает опубликованный под свободными лицензиями. Бывает и вовсе не являющийся объектом АП - текст закон, например. Так в какие статьи вы собираетесь шаблон {{copyvio}} ставить?
- 3. Понимаете ли вы, что процент копивио означает не процент заимствованного текста в статье, а процент заимствования из отдельных конкретных источников (а общий процент выдаётся по самому высшему показателю)? Почему шаблон сообщает, будто заимствована «вся статья целиком»? Каким образом бот это определил? Почему вы пишите, что при 60% не приходится сомневаться в ложности срабатывания? То есть, если автор позаимствует цитату из источника, где всего одна эта цитата и пару строк текста, то процент копивио в статье на десять экранов может составить 90%.--Iluvatar обс 11:14, 15 февраля 2018 (UTC)
- А что плохого собственно в размещение на СО статей шаблонов? Бот показал безупречный результат. За всё время работы с сервисом не увидел никаких ложных срабатываний. Бот уведомляет о копивио только при 60% — а при таком проценте, на секундочку, сомневаюсь в ложном срабатывании. В обсуждении речь шла про 17% (или чуть более). За время работы бота было удалено уже несколько страниц по О11. Да и тривиальных данных недостаточно для создания статьи, поэтому всё равно её нести на удаление. А за вчерашний день бот проверил более 30 новых страниц, и не одного ложного реагирования. Те, где было копивио — либо вырезано, либо удалены, либо ждут удаления. --OlegCinema (обс.) 10:39, 15 февраля 2018 (UTC)
На всё сразу:
Во-первых, я совершил ошибку, сделав в шаблоне такой громкий и вопиющий заголовок, стоит изменить на более нейтральный (Статью следует проверить на наличие нарушений АП). В самом же тексте написано, что прежде чем предпринимать какие-либо действия по отношению к статье, стоит проверить, так ли это. Никто не исключает, что в тексте может быть и свободный текст. Бот же не удаляет статьи, не выносит их на КБУ, и тем более не убирает текст сам. Он тихо и спокойной уведомляет и вставляет список — а там уже дело людей. <То есть, если автор позаимствует цитату из источника, где всего одна эта цитата и пару строк текста, то процент копивио в статье на десять экранов может составить 90%> — сомневаюсь, что такие статьи впринципе должны существовать в Википедии. Это либо КБУ, либо обычное удаление. Во всяком случае, нужно обозначить, что для нас «пару строк текста» — это эти строки могут быть по два слова, могут по предложению. --OlegCinema (обс.) 11:30, 15 февраля 2018 (UTC)
<На страницу обсуждения статьи прилетает шаблон> — очень странно. У меня в один экран. --OlegCinema (обс.) 11:32, 15 февраля 2018 (UTC)
- Так. Давайте ещё раз. Статья в Википедии может быть огромная, на 100 экранов. Но в ней заимствована цитата из внешнего источника, который сам состоит из двух с половиной строк. Две строки мы позаимствовали. И получили под 70% копивио. Этот инструмент показывает наивысший процент заимствования со стороны источников, а не процент заимствований в статье вообще. Вы принцип работы инструмента не понимаете. В общем, я против размещения на СО статей, СО авторов или в самих статьях каких-либо шаблонов сего бота. Ждём ещё мнений.--Iluvatar обс 11:36, 15 февраля 2018 (UTC)
- А зачем нам процент заимствования статьи вообще, я не понимаю. Достаточно сайта, где самое большое количество заимствования. рассмотрим пример. Здесь отчётливо видно, что заимствованно, откуда, и какой процент из статьи. Я не понимаю, что здесь, собственно, не так? У вас есть вариант лучше? Ладно. А куда вы предлагаете размещать информацию о копивио? В никому почти не нужный список? Легче уведомить на СО статьи, чтобы было видно. А на СО автора бот и не собирается ничего отправлять. Забавно, что раньше бота выдавали всем подряд, даже без причины на то, а сейчас флаги снимают (по анализу архива). Что именно в боте не устраивает? Давай начнём обсуждение на форуме, посмотрим. Мне уже самому стало интересно, делать так или нет. Всё таки лучше копивио на ранних стадиях выявлять, а не через 1 год. --OlegCinema (обс.) 11:45, 15 февраля 2018 (UTC)
- Мне кажется, что confidence, уверенность, измеряет только совпадение фрагментов и не имеет отношения ни к доле статьи Википедии, ни к доле сравнивания источника; в любом случае перед простановкой таких шаблонов хотелось бы увидеть не шесть примеров,
из которых два ошибочных(upd.: убрано — не предупреждение, а копивио), а порядка пятидесяти, чтобы можно было прикинуть долю ошибок. P. S. Поясняю: бот с 20% ложных срабатываний отработает правильно на 6 примерах с вероятностью 25%, а порог доверительной вероятности обычно 5% или 1%, то есть мы даже не можем нормально оценить вероятность ошибки таким большим числом как 20%, статистики недостаточно. Викизавр (обс.) 11:49, 15 февраля 2018 (UTC)- @Wikisaurus: Он и до этого проверял, только в виде теста и никакие шаблоны не ставил [11]. Там все проверки, без разницы, меньше они или нет. Самое нижнее вставлял я. Примеру будут, бот же не может специально создавать статьи копивио. По мере их вставке они будут добавляться в список, в случае обнаружения. --OlegCinema (обс.) 11:53, 15 февраля 2018 (UTC)
- А где там ошибочных примера? --OlegCinema (обс.) 11:54, 15 февраля 2018 (UTC)
- Согласен, что номинация сделана рановато, надо 3 суток потестить и оформить. Привлечение внимания поможет в этом. --Vladis13 (обс.) 12:45, 15 февраля 2018 (UTC)
- «Статья в Википедии может быть огромная, на 100 экранов. Но в ней заимствована цитата из внешнего источника, который сам состоит из двух с половиной строк. Две строки мы позаимствовали. И получили под 70 % копивио. Этот инструмент показывает наивысший процент заимствования со стороны источников, а не процент заимствований в статье вообще. Вы принцип работы инструмента не понимаете.» — приведите пример, пожалуйста. --Vladis13 (обс.) 12:45, 15 февраля 2018 (UTC)
- Зачем вам пример? Чтобы понять принцип работы тулзы? Окей, выше статья о Франклине с 70+%.--Iluvatar обс 13:05, 15 февраля 2018 (UTC)
- Где там «в ней заимствована цитата из внешнего источника, который сам состоит из двух с половиной строк. Две строки мы позаимствовали. И получили под 70 % копивио»? Не говоря про «Статья в Википедии может быть огромная, на 100 экранов.» --Vladis13 (обс.) 13:30, 15 февраля 2018 (UTC)
- Зачем вам пример? Чтобы понять принцип работы тулзы? Окей, выше статья о Франклине с 70+%.--Iluvatar обс 13:05, 15 февраля 2018 (UTC)
- Есть такое понятие, как избыточность цитирования. По правилам ВП:АП и ВП:ЦИТ цитаты крайне желательно переписывать (понятно, кроме случаев иллюстрации материала) и их не может быть больше 30 % в разделе. Правило ВП:АП очень строгое, ибо грозит судебными тяжбами Проекту, поэтому статьи с копивио сразу выставляются на КБУ с предупреждением вверху статьи. В случае с ботом, конечно его результат надо проверять, и предупреждать только на СО. Границу в 60 % я тоже считаю достаточно низкой, но приемлемой, пока по этой границе были найдены только копивио, в случае ложных срабатываний поднимем.
- «Я написал статью Экспедиция Франклина (1845—1847). В ней процент возможного копивио аж 72,1 %. ... «Будто бы моя статья должна быть „срочно выставлена на быстрое удаление“ (!). Я кручу пальцем у виска, обижаюсь и ухожу из проекта. Как вы собираетесь предотвращать подобные ситуации?»» — Бот проверят только первые правки новых статей. В данном примере цитаты можно было бы сократить. В любом случае по этой границе предупреждение будет мягкое, лучше оформить как рекомендацию. Похожий случай был со этой статьей, автор исправил именно после предупреждения на СО. Там был только англ. текст, он перевел на рус., но статья всеровно удалена по КБУ как не значимая. Обиду вызывает _любое_ выставление на КБУ и просто КУ по незначимости, когда даже при наличии пачки АИ, докапываются до чего-нибудь и удалают, и это изгоняет как новых, так и опытных участников; увы, но се ля ви.
- «заимствование — это не всегда копивио ... бывает тривиальный текст, ... текст в ОД, ... под свободными лицензиями. ... не являющийся объектом АП — текст закон, например.» — В сервисе существует игнорлист (Вот именно такой случай: свободный текст, был обновлен игнорлист сервиса, больше копивио не считается.) Дополнительный можно добавить боту. Тривиальный текст сервис не учитывает, только длинные словосочетания. Свободные тексты и ОД в Википедии не публикуются. --Vladis13 (обс.) 12:45, 15 февраля 2018 (UTC)
- Vladis13, будьте добры, напишите, как Вы понимаете процент, который показывает детектор копивио. Викизавр (обс.) 12:48, 15 февраля 2018 (UTC)
- У меня нет ссылок как именно там. Но уверен, это общеизвестный алгоритм шинглов, используемый в SEO, рерайтинге и генерации текстов, повсеместно в поисковиках вроде Google, Яндекс, и т. п., на биржах статей и рерайтинга, откуда берется масса статей опубликованных в интернет, вроде text.ru, Адвего и т. п. Напомню, если поисковики посчитают текст не уникальным по такому проценту, то статья просто не будет показываться в результатах поиска в интернет, то есть использование подобных проверок глобально и серьезно. Я несколько лет не занимаюсь этой темой, т.ч. призабыл подробности. Скажу только, что шингл — это последовательность из определённого числа слов (обычно 5-8), которые сравниваются на уникальность с другими текстами. --Vladis13 (обс.) 13:15, 15 февраля 2018 (UTC)
- "Бот проверяет только первые правки" — это какое отношение имеет к разговору? "Можно подсократить" — текст ключевой для статьи находящийся в ОД цитаты? Чтобы бот не ругался? "Свободные тексты и ОД в Википедии не публикуются" — ну, теперь всё понятно.--Iluvatar обс 13:05, 15 февраля 2018 (UTC)
- По определению, в первой правке статьи — сырые. Если цитата важна, участник пометит на СО, что нет проблем, также для этого там предусмотрен специальный статус. Вообще, к первым правкам любых статей всегда есть вопросы, не припомню исключений. Если добавляемый текст скопирован из свободного источника в статье должен быть шаблон (+возможно категория) поясняющая это, укажите их — добавим в игнорлист. --Vladis13 (обс.) 13:28, 15 февраля 2018 (UTC)
- Вопросы: 1) Какую роль в разработке бота сыграл OlegCinema? Код, как я понимаю, написан целиком Владом. Если я прав, то Олег с ним хотя бы знакомился? Если я не прав, то какую его часть написал Олег? 2) Как бот планирует хоститься (на лабсе, как я понимаю) — отдельным инструментом или на аккаунте Влада? 3) Зачем такому относительно несложному боту два обслуживающих ботовода? Как будут распределяться обязанности? Какое вообще обслуживание требует бот, кроме слежения за отчётами? На первые два вопроса хотелось бы услышать ответ от Влада, на последний — от Олега. ~Facenapalm 13:42, 15 февраля 2018 (UTC)
- Отвечаю на третий вопрос: бот никому не принадлежит, мы писали его вместе с Владом. У меня планируется отдельный, мой бот, как у него нынешние. Скажем так, это наш совместный проект. Обязанности? Мы планируем вместе работать над ним, исправлять ошибки. Я буду заниматься логами, в данный момент созданием функции оповещение участников о новом копивио (подробного говорить не буду, отношение не имеет), да и просто поддерживать бота. Впереди ещё будет много ошибок, которые придётся быстро исправлять. Кто знает, кто будет в сети. Бот требует постоянную проверку логов на ошибки. Постоянный мониторинг за ними. В будущем — также улучшения и новые функции. --OlegCinema (обс.) 13:58, 15 февраля 2018 (UTC)
- «мы писали его вместе с Владом» — ладно, тогда вопрос всё-таки тебе: какие функции из этого кода писал лично ты? ~Facenapalm 14:16, 15 февраля 2018 (UTC)
- Я занимался постингом в Википедию под нужным процентом в таблицу, постинг на СО статьи, а также логи. Влад в основном занимался кодом самой проверки (подключением через API к сервису). Я с тем, что связано с постингом и отображением под нужным процентом тут. --OlegCinema (обс.) 14:23, 15 февраля 2018 (UTC)
- Также я настраивал отключение проверки страниц неодназначностей и перенаправлений. --OlegCinema (обс.) 14:24, 15 февраля 2018 (UTC)
- Я занимался постингом в Википедию под нужным процентом в таблицу, постинг на СО статьи, а также логи. Влад в основном занимался кодом самой проверки (подключением через API к сервису). Я с тем, что связано с постингом и отображением под нужным процентом тут. --OlegCinema (обс.) 14:23, 15 февраля 2018 (UTC)
- «мы писали его вместе с Владом» — ладно, тогда вопрос всё-таки тебе: какие функции из этого кода писал лично ты? ~Facenapalm 14:16, 15 февраля 2018 (UTC)
- Намного лучше, когда бота поддерживают два ботовода. --OlegCinema (обс.) 14:00, 15 февраля 2018 (UTC)
- Идея и продвижение Олега, без него я бы просто не взялся. В общем, frontend, почти все текстовые сообщения, постинг в вики - Олега, backend - в основном мой. Хостится на лабсе на моем аккаунте, ибо всё настроено, а заводить новый там заморочно. Не думаю, что у бота будут тех.проблемы. Настройки обсуждаемы. Второй оператор обязательно нужен, ибо у меня совсем мало времени на ВП, только тех.вопросы. --Vladis13 (обс.) 14:20, 15 февраля 2018 (UTC)
- @Vladis13: то есть, Олег не имеет и никогда не будет иметь доступа к серверу, где хостится бот, в частности - не будет иметь возможность дописывать и изменять код без твоего участия. Так? В таком случае, каким образом и что именно он сможет менять (останавливать бота? Редактировать белые списки?)? ~Facenapalm 14:25, 15 февраля 2018 (UTC)
- Я не понимаю немного, какой смысл эти вопросы имеют непосредственно к статусу? Насчёт белых списков: они не у бота, эти списки на самом сервисе. Он просто их игнорирует (ссылки при проверке). А доступ я имею, и в любое время могу редактировать код. Прошу прощения, что я отвечаю на вопрос. Исходит ощущение, что снова меня в чём-то подозревают. Есть прямые вопросы — спросите прямо. Вокруг да около ходить не надо. --OlegCinema (обс.) 14:31, 15 февраля 2018 (UTC)
- Никаких подозрений нет. Но и доверия (не в плане добросовестности, а в плане достаточной технической подкованности) к тебе как к ботоводу пока тоже нет. Вокруг да около не хожу, вопросы я задаю самые прямые (и извиняюсь, если ими задеваю). Просто писать 200-строчный скрипт вдвоём — нонсенс, поэтому я предполагаю, что у бота, фактически, один автор и обслуживать его будет, фактически, один человек. «Намного лучше, когда бота поддерживают два ботовода» — это неправда. Во-первых, может иметь место перекладывание ответственности, во-вторых, шанс внести ошибку в чужой код куда выше, чем в свой. ~Facenapalm 15:42, 15 февраля 2018 (UTC)
- Чужой код? Не смешно, правда, учитывая, что 1/3 писал я. Расскажу глобальный секрет, но я с ним знакомился, с той частью, которую писал Влад. --OlegCinema (обс.) 23:55, 15 февраля 2018 (UTC)
- Никаких подозрений нет. Но и доверия (не в плане добросовестности, а в плане достаточной технической подкованности) к тебе как к ботоводу пока тоже нет. Вокруг да около не хожу, вопросы я задаю самые прямые (и извиняюсь, если ими задеваю). Просто писать 200-строчный скрипт вдвоём — нонсенс, поэтому я предполагаю, что у бота, фактически, один автор и обслуживать его будет, фактически, один человек. «Намного лучше, когда бота поддерживают два ботовода» — это неправда. Во-первых, может иметь место перекладывание ответственности, во-вторых, шанс внести ошибку в чужой код куда выше, чем в свой. ~Facenapalm 15:42, 15 февраля 2018 (UTC)
- Доступ имеет. Отдельная заявка для этого бота подана именно чтобы не мешать его вклад с другими ботами. В случае чего его может остановить любой администратор обычным методом. Ещё, Олег предлагает сделать страницу настроек бота в Вики, откуда его можно будет и отключать. Если очень надо, можно на лабс завести отдельную учётку, но просто заморочно её настраивать (групповые права, доступ по ssh-ключам). Белые списки (игнорлист) есть в самом сервисе — наверху ссылка, там переход на англовики где его настройки. И, спасибо за идею, можно доб. доп. списки в бот, и например вывести их настройку на подстраницу бота в вики (просто пока нет статистики, нужно ли это). UPD: + Сервис использует обширные белые списки Википедии, обновил раздел тех.подробностей. --Vladis13 (обс.) 14:39, 15 февраля 2018 (UTC)
- Зачем же отдельный аккаунт? Просто отдельный инструмент, регистрирующийся нажатием на кнопку, которому в мейнтейнеры можно добавить от одного до бесконечности аккаунтов. Ты, я надеюсь, не передал Олегу ssh-доступ к своему основному аккаунту? ~Facenapalm 15:46, 15 февраля 2018 (UTC)
- Попробую. :)
- Зачем же отдельный аккаунт? Просто отдельный инструмент, регистрирующийся нажатием на кнопку, которому в мейнтейнеры можно добавить от одного до бесконечности аккаунтов. Ты, я надеюсь, не передал Олегу ssh-доступ к своему основному аккаунту? ~Facenapalm 15:46, 15 февраля 2018 (UTC)
- Я не понимаю немного, какой смысл эти вопросы имеют непосредственно к статусу? Насчёт белых списков: они не у бота, эти списки на самом сервисе. Он просто их игнорирует (ссылки при проверке). А доступ я имею, и в любое время могу редактировать код. Прошу прощения, что я отвечаю на вопрос. Исходит ощущение, что снова меня в чём-то подозревают. Есть прямые вопросы — спросите прямо. Вокруг да около ходить не надо. --OlegCinema (обс.) 14:31, 15 февраля 2018 (UTC)
- @Vladis13: то есть, Олег не имеет и никогда не будет иметь доступа к серверу, где хостится бот, в частности - не будет иметь возможность дописывать и изменять код без твоего участия. Так? В таком случае, каким образом и что именно он сможет менять (останавливать бота? Редактировать белые списки?)? ~Facenapalm 14:25, 15 февраля 2018 (UTC)
- Отвечаю на третий вопрос: бот никому не принадлежит, мы писали его вместе с Владом. У меня планируется отдельный, мой бот, как у него нынешние. Скажем так, это наш совместный проект. Обязанности? Мы планируем вместе работать над ним, исправлять ошибки. Я буду заниматься логами, в данный момент созданием функции оповещение участников о новом копивио (подробного говорить не буду, отношение не имеет), да и просто поддерживать бота. Впереди ещё будет много ошибок, которые придётся быстро исправлять. Кто знает, кто будет в сети. Бот требует постоянную проверку логов на ошибки. Постоянный мониторинг за ними. В будущем — также улучшения и новые функции. --OlegCinema (обс.) 13:58, 15 февраля 2018 (UTC)
- В общем, ситуацию я вижу так: автор идеи и болеющий за работу бота — Олег, но он не обладает достаточным умениями для написания подобного бота, потому он обратился к Владу, который, фактически, написал основной код, а Олег, желая поучаствовать в разработке хоть как-то, занимался рутинными второстепенными опциями. В дальнейшем Олег планирует и дальше развивать второстепенную часть бота, а Влад активного участия в жизни бота принимать не планирует. И тут возникает проблема.
Бот в текущем виде требует существенных доработок (явно следует ввести ценз не только — и не столько — по проценту скопированного источника, но и по его объёму; возможно, стоит научить его парсить страницу сравнения версий и исключать blockquote и прочие цитаты; и т. д., и т. п.). «Проверка только первой правки» — тоже сомнительное условие: удалённое копивио найдётся, а созданная пятидесятью правками статья — нет? Сейчас бот может быть очень полезен для составления списков «эти статьи стоит просмотреть» в ЛП (в ЛП Олега?), которые, как показывает практика, владельцу же разгребать и придётся, и для которых я не вижу нужды в заведении нового аккаунта. Писать на СО новосозданных статей смысла немного: это увидит только автор статьи и, скорее всего, тут же испугается и удалит сообщение, гости на СО вообще вряд ли заглянут; расставление плашек по статьям с возможным занесением в категории куда более оправдано (с учётом того, что даже удалённые плашки должен увидеть патрулирующий), но это требует обсуждения и доработки бота.
Влад — опытный ботовод, он всё это понимает и я ему всецело доверяю. Если развитием бота будет заниматься он и он считает, что ему нужен новый аккаунт, я не могу быть против. То есть, если работа будет течь в русле «Влад занимается кодом, а Олег — шаблонами, белыми списками, контактами с сообществом и, собственно, разгребанием найденного», то всё отлично. Но в этом случае ботмастером стоит сделать Влада, а Олег не должен иметь технической возможности совершать из-под аккаунта правки. Если это не так (по-видимому, наш вариант), то я отношусь к заявке крайне настороженно. Олегу, на мой взгляд, становится ботоводом рано, а привлечение соавтора для написания маленького скрипта — очень плохой знак, намекающий, что поддерживать бота он может не в состоянии. Это всё ИМХО и я прошу не принимать близко к сердцу. ~Facenapalm 15:42, 15 февраля 2018 (UTC)- Очень приятно слышать, когда ты участвовал в написании самого кода, создал сам аккаунт, настроил его. Ну спасибо, что сказать. Однако я не против первого варианта. Мне не принципиально иметь доступ к этому всему. Написать свой код я могу в обычном ноутпаде, передав потом его Владу. Влад больше специализируется на технических аспектах, он начал участвовать в этому обсуждении очень пассивно. У него много и других дел, кроме того, что бы что-то тут доказывать. Изначально бота планировал я, но из-за небольшого опыта и некоторых проблем в написании я обратился ко Владу. Он уже мне помог с самой проверкой. Очень неприятно, опять же слышать — тот не автор, ты автор. Это крайне недружественно и очень обидно. --OlegCinema (обс.) 16:08, 15 февраля 2018 (UTC)
- Уточню, что по правилу ВП:ППБ#Боты, управляемые несколькими участниками Олег таки соответствует критериям ботосовладельца. Как минимум, все эти таблицы и шаблоны правит он, + правка обговоренных не сложных функций бота. Это все входит в понятие «бота», ибо без постинга в вики бота нет. «Олег, желая поучаствовать в разработке хоть как-то, занимался рутинными второстепенными опциями. В дальнейшем Олег планирует и дальше развивать второстепенную часть бота, а Влад активного участия в жизни бота принимать не планирует.» — не соглашусь, что работа Олега рутинная и второстепенная. «Влад активного участия в жизни бота принимать не планирует» — не так, я постоянно поддерживаю мои боты здесь и Викитеке. --Vladis13 (обс.) 17:30, 15 февраля 2018 (UTC)
- «„Проверка только первой правки“ — тоже сомнительное условие: удалённое копивио найдётся, а созданная пятидесятью правками статья — нет?» — проверка всех правок Википедии не входит в заявленную задачу бота. Только отлов нарушений на начальном этапе. Хотя можно попробовать обратится к разработчикам сервиса. А если ставить вниз статьей шаблончик, с коротким предупреждением, + категоризацией? Также ссылку на список (и может категорию) выложить в шапку форумов ПАТ и АП? «парсить страницу сравнения версий и исключать blockquote и прочие цитаты», — не, сервис проверки принимает только название статьи (проверяя текущую версию), или определённую версию, текст статей туда не отправляется. --Vladis13 (обс.) 17:40, 15 февраля 2018 (UTC)
- Кто именно будет являться владельцем бота? Lazyhawk (обс.) 20:35, 27 февраля 2018 (UTC)
- Можете написать меня, ибо Влад не хочет быть «лицом» бота. А так, по правилам, разрешено два оператора. OlegCinema (обс.) 00:03, 28 февраля 2018 (UTC)
- Мы не обсуждаем сейчас формальную сторону. Кто именно будет отвечать за действия бота, и кому коллеги могут адресовать возможные претензии? Вы читали ВП:ППБ? Если да, то где в описании правок указывается основной оператор бота? Lazyhawk (обс.) 00:12, 28 февраля 2018 (UTC)
- Можно написать на СО бота. Первый, кто увидет — отреагирует. OlegCinema (обс.) 00:25, 28 февраля 2018 (UTC)
- Поясните пожалуйста раздел правила об этом. Непонятное. Там написано: «Боты, управляемые несколькими операторами, допускаются при следующих условиях: а) раскрытие оператора — должно быть ясно показано, под чьим руководством совершаются те или иные правки, это обычно указывается в описании к правке;». Если операторов, по этому определению, несколько, то почему указывать только одного? Не припомню, чтобы в описаниях правок ботов указывался оператор. Всегда любые комментарии пишутся на СО бота, где есть и ссылки на операторов и там же они отвечают? Или правила как-то изменились? --Vladis13 (обс.) 00:53, 28 февраля 2018 (UTC)
- Потому, что в данном случае любой участник ВП должен знать определённо и точно — к кому обращаться насчёт возможных некорректных действий. В случае мультиводства моё мнение — человек не должен решать ребус из возможных вариантов. Хотя, другие, бюрократы, конечно, могут иметь другое мнение. Lazyhawk (обс.) 00:57, 28 февраля 2018 (UTC)
- А можно увидеть пример такого описания правок? А то немного диким представляется описание, вроде: «Обновление списка статей подозреваемых в КОПИВИО. По техн. вопросам обращайтесь к оператору Vladis13, для иных обсуждений к участнику OlegCinema». --Vladis13 (обс.) 01:10, 28 февраля 2018 (UTC)
- Мне всё равно, как вы это сделаете. Целевым результатом должно быть понимание, к кому именно обращаться в случае возникновения проблем(ы). Lazyhawk (обс.) 01:21, 28 февраля 2018 (UTC)
- Так я готов написать что требуется, но не понимаю что требуется. Можно увидеть пример описания правок ботов с несколькими владельцами? Всегда обращаются на СО ботов. Ну не знаю, пусть ко мне обращаются. --Vladis13 (обс.) 01:42, 28 февраля 2018 (UTC)
- Мне всё равно, как вы это сделаете. Целевым результатом должно быть понимание, к кому именно обращаться в случае возникновения проблем(ы). Lazyhawk (обс.) 01:21, 28 февраля 2018 (UTC)
- А можно увидеть пример такого описания правок? А то немного диким представляется описание, вроде: «Обновление списка статей подозреваемых в КОПИВИО. По техн. вопросам обращайтесь к оператору Vladis13, для иных обсуждений к участнику OlegCinema». --Vladis13 (обс.) 01:10, 28 февраля 2018 (UTC)
- Потому, что в данном случае любой участник ВП должен знать определённо и точно — к кому обращаться насчёт возможных некорректных действий. В случае мультиводства моё мнение — человек не должен решать ребус из возможных вариантов. Хотя, другие, бюрократы, конечно, могут иметь другое мнение. Lazyhawk (обс.) 00:57, 28 февраля 2018 (UTC)
- Дальше. Есть серьёзная проблема, поднятая коллегой Iluvatar. Я переформулирую её следующим образом: в ВП есть достаточно много статей, наполнение который тривиально. Текущая логика Вашего бота будет определять данные статьи, как подозрительные на копипаст. С этим что-то делалось? Lazyhawk (обс.) 00:15, 28 февраля 2018 (UTC)
- Такого не может быть, отсутствие подобных ложных срабатываний можно увидеть по списку результатов. Текст проверяется на уникальность порядка и состава слов. Если точно такой текст уже есть в интернет, статья по определению скопирована. --Vladis13 (обс.) 00:21, 28 февраля 2018 (UTC)
- Да как же не может быть? Есть как минимум два варианта, выпадающие за текущую логику: а) краткое перечисление биографии персоналии, и б) копирование текста из источника, лицензия которого совместима с ВП. Lazyhawk (обс.) 00:26, 28 февраля 2018 (UTC)
- Во-первых, бот не заявляет, что «ТО КОПИВИО, УДАЛЯЙТЕ». Он всего-то говорит «Ребят, проверьте это, там может быть нарушение АП». Он не ставит шаблон КБУ. Во-вторых. Как было упомянуто выше, существуют белые списки сайтов с совместимой лицензией. Даже если этого сайта нет, всё равно нужно будет проверить, а указан ли автор, как положено и так далее. На моей практике встречались и такие ситуации, когда в списке был текст с совместимой лицензией, а его всё-же удаляли по КБУ, так как не был указан автор. OlegCinema (обс.) 00:33, 28 февраля 2018 (UTC)
- В текущем виде бот заявляет что-то. Причём, неважно куда — на СО страницы, ЛСО автора, куда-то ещё, он просто шлёт уведомления. Мне совершенно непонятно в этом случае их ценность — в самом крайнем варианте, имея дело с отъявленным копипастером, он проигнорирует сообщение от бота на ЛСО и всё. А на сообщения на СО статьи размещать ботом без проверки на копипаст с совместимых источников не даст ни один бюрократ. Я потому и спрашивал — с этим что-то делалось или нет? Lazyhawk (обс.) 00:37, 28 февраля 2018 (UTC)
- Постинг сообщений на СО был отключен в день подачи заявки. --Vladis13 (обс.) 00:42, 28 февраля 2018 (UTC)
- Переопишите тогда логику вашего бота. Lazyhawk (обс.) 00:43, 28 февраля 2018 (UTC)
- Было решено, что на СО не будет ставиться шаблон, и не потому, что могут быть ложные срабатывания, а причин много, и почти все они, так сказать, моральные. OlegCinema (обс.) 00:42, 28 февраля 2018 (UTC)
- Постинг сообщений на СО был отключен в день подачи заявки. --Vladis13 (обс.) 00:42, 28 февраля 2018 (UTC)
- В текущем виде бот заявляет что-то. Причём, неважно куда — на СО страницы, ЛСО автора, куда-то ещё, он просто шлёт уведомления. Мне совершенно непонятно в этом случае их ценность — в самом крайнем варианте, имея дело с отъявленным копипастером, он проигнорирует сообщение от бота на ЛСО и всё. А на сообщения на СО статьи размещать ботом без проверки на копипаст с совместимых источников не даст ни один бюрократ. Я потому и спрашивал — с этим что-то делалось или нет? Lazyhawk (обс.) 00:37, 28 февраля 2018 (UTC)
- «Тривиальность» это другое, это общеупотребляемые фразы, вроде «пошел дождь и она раскрыла зонтик». Такие фразы не длинные и на процент не влияют. а) Это случай фактической информации, на которую АП не распространяются. Как и в случае с тривиальностью, такие фразы слишком короткие. Как предложено выше, можно добавить ограничение на сканирование по размеру статей (пока таких случаев не попадалось). б) Другой случай. Как описано выше, сервис проверки имеет несколько обширных белых списков сайтов со свободными лицензиями. Дополнительно можно добавить фильтр по шаблонам и категориями таких лицензий. --Vladis13 (обс.) 00:36, 28 февраля 2018 (UTC)
- Вернёмся на шаг назад. Ваш бот учитывает 100% заимствование с таких сайтов, например, как warheroes.ru? Если нет, то мы обсуждаем воздух. Lazyhawk (обс.) 00:40, 28 февраля 2018 (UTC)
- Если сайт внесен в белый список, то викистатья с ним не сравнивается. Повторюсь, что можно добавить фильтр при наличии в статье шаблона/категории, упоминающих на внесенный текст есть свободная лицензия. (Но на данный момент, я не нашел даже категорий для этого, с АП в рувики ситуация совсем неразвитая. )--Vladis13 (обс.) 00:47, 28 февраля 2018 (UTC)
- Это совсем не так, поверьте. Механизм ОТРС, весьма динамичный причём, не отменял ещё никто. Можно добавить фильтр - это гуд. Но к тому времени на ЛСО коллег будет по факту полный флуд, вы (оба) представляете весь процесс в полном его виде? Lazyhawk (обс.) 00:49, 28 февраля 2018 (UTC)
- На данный момент бот создаёт только список подозрительных статей на своей подстранице. Консенсуса по предупреждениям на СО/статьи/ЛСО нет, поэтому они отключены. Я бы предложил добавить ссылку на список на страницы запросов ПАТ и форум АП, где участники заинтересованны именно в таком инструменте. --Vladis13 (обс.) 01:04, 28 февраля 2018 (UTC)
- Я написал всё ниже. Заинтересованность участников, работающих на первичном патрулировании, мне кажется эфемерной. Это один из самых сложных секторов работы в ВП, и самый неблагодарный. Когда ты постоянно работаешь с архивом статей, выявляя откуда и куда пошёл текст. Одна статья за полчаса. И без всяких висюлек (наград за патрулирование). Это совершенно неавтоматизируемо, поэтому касаться данного пласта работы даже не будем - бот здесь будет просто вреден имхо. Lazyhawk (обс.) 01:13, 28 февраля 2018 (UTC)
- Не могу согласится, список бота в один клик показывает статьи с подозрением на КОПИВИО, откуда и сколько скопировано. Помощь неоценимая. --Vladis13 (обс.) 01:20, 28 февраля 2018 (UTC)
- Каким образом Ваш бот будет определять откуда скопировано? Учитывая массовое тиражирование информации по факту из ВП. Lazyhawk (обс.) 01:24, 28 февраля 2018 (UTC)
- См. 2-й пункт в "Технические подробности". --Vladis13 (обс.) 01:35, 28 февраля 2018 (UTC)
- Куда будет размещаться результат. Частота прохода. Область прохода ботом. Формирование белых списков. Их коррекция. Примеры. Lazyhawk (обс.) 01:39, 28 февраля 2018 (UTC)
- 1) См. 4-й пункт в "Технические подробности", 2) 2-й, 3) 2-й первое предлож., 4) 6-й пункт, примеры и формат списка по ссылкам. --Vladis13 (обс.) 01:53, 28 февраля 2018 (UTC)
- Боюсь показаться нудным, но формирование белых списков и их коррекция — ? По остальному, с Вашего позволения, я возьму таймаут до субботы. Lazyhawk (обс.) 19:16, 28 февраля 2018 (UTC)
- Уточните вопрос и я попробую ответить. Мне кажется в общем я ответил, сославшись на "Технические подробности" п.6: «В сервисе проверки имеется белый список сайтов (игнорлист), также учитываются игнорлисты en:Wikipedia:Mirrors and forks и meta:User:EranBot/Copyright/Blacklist. Можно сделать дополнительный список.» => По каждой ссылке там подробная инструкция. У «Wikipedia:Mirrors and forks» есть русская версия ВП:КЛОН, со списком зеркал Википедии. --Vladis13 (обс.) 16:44, 3 марта 2018 (UTC)
- Боюсь показаться нудным, но формирование белых списков и их коррекция — ? По остальному, с Вашего позволения, я возьму таймаут до субботы. Lazyhawk (обс.) 19:16, 28 февраля 2018 (UTC)
- 1) См. 4-й пункт в "Технические подробности", 2) 2-й, 3) 2-й первое предлож., 4) 6-й пункт, примеры и формат списка по ссылкам. --Vladis13 (обс.) 01:53, 28 февраля 2018 (UTC)
- Куда будет размещаться результат. Частота прохода. Область прохода ботом. Формирование белых списков. Их коррекция. Примеры. Lazyhawk (обс.) 01:39, 28 февраля 2018 (UTC)
- См. 2-й пункт в "Технические подробности". --Vladis13 (обс.) 01:35, 28 февраля 2018 (UTC)
- Каким образом Ваш бот будет определять откуда скопировано? Учитывая массовое тиражирование информации по факту из ВП. Lazyhawk (обс.) 01:24, 28 февраля 2018 (UTC)
- Не могу согласится, список бота в один клик показывает статьи с подозрением на КОПИВИО, откуда и сколько скопировано. Помощь неоценимая. --Vladis13 (обс.) 01:20, 28 февраля 2018 (UTC)
- Я написал всё ниже. Заинтересованность участников, работающих на первичном патрулировании, мне кажется эфемерной. Это один из самых сложных секторов работы в ВП, и самый неблагодарный. Когда ты постоянно работаешь с архивом статей, выявляя откуда и куда пошёл текст. Одна статья за полчаса. И без всяких висюлек (наград за патрулирование). Это совершенно неавтоматизируемо, поэтому касаться данного пласта работы даже не будем - бот здесь будет просто вреден имхо. Lazyhawk (обс.) 01:13, 28 февраля 2018 (UTC)
- На данный момент бот создаёт только список подозрительных статей на своей подстранице. Консенсуса по предупреждениям на СО/статьи/ЛСО нет, поэтому они отключены. Я бы предложил добавить ссылку на список на страницы запросов ПАТ и форум АП, где участники заинтересованны именно в таком инструменте. --Vladis13 (обс.) 01:04, 28 февраля 2018 (UTC)
- К тому же, вы, как потенциальные ботовладельцы, не понимаете сейчас, что тот же warheroes.ru не является белым полностью. Lazyhawk (обс.) 00:52, 28 февраля 2018 (UTC)
- Тогда не добавлять некий сайт полностью. Например "thesaurus.rusnano.com", что не затрагивает "rusnano.com". В любом случае, в статье должен быть шаблон, иначе это будет плагиат. --Vladis13 (обс.) 00:59, 28 февраля 2018 (UTC)
- Я не согласен насчёт любого случая. Ок, переопишите логику бота с учётом этой дискуссии, дальше посмотрим. Lazyhawk (обс.) 01:01, 28 февраля 2018 (UTC)
- Обновил. --Vladis13 (обс.) 01:35, 28 февраля 2018 (UTC)
- В случае вархероез чистоту текста нельзя определить по поддомену. Часть авторов вархероез прислала отрс-разрешения на свои тексты, но урлом эти тексты не отличаются от остальных. MBH 10:02, 28 февраля 2018 (UTC)
- Я не в курсе про конкретно данный сайт. В целом, если не подходит фильтр по url, то надо добавить фильтр по Категория:Википедия:Статьи, имеющие OTRS-разрешение и подкатегориям в Категория:Википедия:Авторские права. Предлагаю позже открыть тему на СО бота, обсудить его развитие и фичи. На данный момент это не критично. Ибо предупреждения на СО отключены, а статьи заносятся в список только по первой правке, и уже могут быть исправлены, может быть добавлен шаблон лицензии. Список бота — вспомогательный инструмент, а не «робот Терминатор». --Vladis13 (обс.) 16:05, 28 февраля 2018 (UTC)
- Я не согласен насчёт любого случая. Ок, переопишите логику бота с учётом этой дискуссии, дальше посмотрим. Lazyhawk (обс.) 01:01, 28 февраля 2018 (UTC)
- Тогда не добавлять некий сайт полностью. Например "thesaurus.rusnano.com", что не затрагивает "rusnano.com". В любом случае, в статье должен быть шаблон, иначе это будет плагиат. --Vladis13 (обс.) 00:59, 28 февраля 2018 (UTC)
- Это совсем не так, поверьте. Механизм ОТРС, весьма динамичный причём, не отменял ещё никто. Можно добавить фильтр - это гуд. Но к тому времени на ЛСО коллег будет по факту полный флуд, вы (оба) представляете весь процесс в полном его виде? Lazyhawk (обс.) 00:49, 28 февраля 2018 (UTC)
- Если сайт внесен в белый список, то викистатья с ним не сравнивается. Повторюсь, что можно добавить фильтр при наличии в статье шаблона/категории, упоминающих на внесенный текст есть свободная лицензия. (Но на данный момент, я не нашел даже категорий для этого, с АП в рувики ситуация совсем неразвитая. )--Vladis13 (обс.) 00:47, 28 февраля 2018 (UTC)
- Вернёмся на шаг назад. Ваш бот учитывает 100% заимствование с таких сайтов, например, как warheroes.ru? Если нет, то мы обсуждаем воздух. Lazyhawk (обс.) 00:40, 28 февраля 2018 (UTC)
- Во-первых, бот не заявляет, что «ТО КОПИВИО, УДАЛЯЙТЕ». Он всего-то говорит «Ребят, проверьте это, там может быть нарушение АП». Он не ставит шаблон КБУ. Во-вторых. Как было упомянуто выше, существуют белые списки сайтов с совместимой лицензией. Даже если этого сайта нет, всё равно нужно будет проверить, а указан ли автор, как положено и так далее. На моей практике встречались и такие ситуации, когда в списке был текст с совместимой лицензией, а его всё-же удаляли по КБУ, так как не был указан автор. OlegCinema (обс.) 00:33, 28 февраля 2018 (UTC)
- Да как же не может быть? Есть как минимум два варианта, выпадающие за текущую логику: а) краткое перечисление биографии персоналии, и б) копирование текста из источника, лицензия которого совместима с ВП. Lazyhawk (обс.) 00:26, 28 февраля 2018 (UTC)
- Можете проверить список, который он сформировал почти за месяц теста. Лично я ложных срабатываний не увидел. OlegCinema (обс.) 00:24, 28 февраля 2018 (UTC)
- Охотно верю. Но мы рассматриваем все варианты, что может случиться. И проблема, поднятая коллегой Iluvatar, нуждается в проработке. Это то, что может случиться в будущем. А если может, то обязательно случится. Lazyhawk (обс.) 00:34, 28 февраля 2018 (UTC)
- Такого не может быть, отсутствие подобных ложных срабатываний можно увидеть по списку результатов. Текст проверяется на уникальность порядка и состава слов. Если точно такой текст уже есть в интернет, статья по определению скопирована. --Vladis13 (обс.) 00:21, 28 февраля 2018 (UTC)
- Мы не обсуждаем сейчас формальную сторону. Кто именно будет отвечать за действия бота, и кому коллеги могут адресовать возможные претензии? Вы читали ВП:ППБ? Если да, то где в описании правок указывается основной оператор бота? Lazyhawk (обс.) 00:12, 28 февраля 2018 (UTC)
- Можете написать меня, ибо Влад не хочет быть «лицом» бота. А так, по правилам, разрешено два оператора. OlegCinema (обс.) 00:03, 28 февраля 2018 (UTC)
- УЗ бота заблокирована до решения здесь. Lazyhawk (обс.) 20:48, 27 февраля 2018 (UTC)
- Прочитал обсуждения. По тому что я увидел. Есть серьезные возражения, касающиеся того, что бот сам не может определить, является заимствование копивио или нет. И никакие белые списки и фильтры проблему не решат. Здесь область авторского права, решение о том, было ли копивио или добросовестное цитирование, должен принимать человек, а не бот. И я не увидел в ответах, что ботоводы полностью разбираются в авторских правах. А потенциально некорректное обвинение (а установка плашки на СО статьи может быть воспринято именно так) может привести к потенциальным конфликтам. Второе возражение: к учетной записи должен иметь доступ только один ботовод. Правилами Википедии общие учётные записи запрещены и должны быть немедленно заблокированы. В общем, я склоняюсь к тому, чтобы в присвоении флага бота в настоящее время отказать. --Vladimir Solovjev обс 13:24, 8 марта 2018 (UTC)
- Хочу поправить: общие боты разрешены. Более частное правило имеет приоритет перед более общим и написанным про учётки людей, а не ботов. MBH 13:43, 8 марта 2018 (UTC)
- Справедливости ради: в упомянутом правиле прямо разрешено владение учёткой бота несколькими людьми (см. последний абзац).--Iluvatar обс 13:56, 8 марта 2018 (UTC)
- Во-первых от идеи ставит на СО шаблон уже давно отказались. Сейчас боту не дают нормально работать даже в ЛП, блокируют его за это. Во-вторых, изначально говорилось, что эти списки будет проверять человек, а не бот. Нигде в обсуждении не было указано, что бот будет что то делать со статьёй. OlegCinema (обс.) 14:33, 8 марта 2018 (UTC)
- Ещё, насчёт АП. Из-за бота было удалено сколько страниц, поставленные шаблоны КБУ мной и Владом...? Да уж штук 10, не меньше. OlegCinema (обс.) 14:34, 8 марта 2018 (UTC)
- Вы понимаете, чем белые списки отличаются от чёрных? Если "в сервисе проверки имеется белый список сайтов", то это означает, что ни с какими другими сайтами он не работает, кроме этого белого списка. Если же он работает со всеми сайтами, но при обработке игнорирует результаты из некоторого списка - то этот список называется чёрным. Def2010 (обс.) 11:29, 21 марта 2018 (UTC)
К итогу
правитьКак вижу, обсуждение заявки заглохло. Думаю, что для оживления обсуждения следует собрать всю важную информацию в одном месте.
На данный момент, рассчитывается использовать бота в следующей конфигурации:
- Отчёт бота помещается на специальную страницу в собственном ЛП, а не на СО статьи
- Проверяются только новые статьи
- Проверяется первая правка в статье
- Дизамбиги и перенаправления не проверяются
- Используется белый список сайтов (игнорлист)
Прошёлся по примерам на странице отчёта Участник:CopyvioCheckerBot/Список. Результаты достаточно хорошие. Единственная обнаруженная проблема состоит в том, что ссылка на сервис проверки https://tools.wmflabs.org/copyvios/ ведёт на проверку текущей версии статьи, а не первой правки, которую проверил бот. Думаю, что как раз это ввело в заблуждение некоторых участников, негативно высказавшихся в этом обсуждении о качестве работы сервиса tools.wmflabs.org/copyvios. Для сравнения: проверка первой правки и проверка последней правки. (Важно — на ссылки надо нажимать по очереди, иначе сайт может выдать ошибку.)
Полагаю, что при таком modus operandi, бот не в состоянии нанести много вреда. В самом худшем случае он испортит страницу своего отчёта. С технической стороны не вижу проблем для присвоения флага.
Единственный вопрос, который до сих пор остался нерешённым — ответственность за бота и доступ к его учётной записи. Здесь я полностью разделяю мнение Facenapalm: «Если работа будет течь в русле „Влад занимается кодом, а Олег — шаблонами, белыми списками, контактами с сообществом и, собственно, разгребанием найденного“, то всё отлично. Но в этом случае ботмастером стоит сделать Влада, а Олег не должен иметь технической возможности совершать из-под аккаунта правки.». Думаю, что для начала это было бы самое оптимальное решение. После того, как бот «повзрослеет» (будут исправлены начальные ошибки, определён и создан базовый набор функций), а самое главное, когда бот завоюет доверие сообщества, можно будет передать доступ к учётке Олегу, который станет полностью ответственным за все аспекты бота. Заниматься техобслуживанием хорошо отлаженного бота намного легче, чем дорабатывать только что созданного. Но это можно будет обсудить в следующей заявке, когда настанет время. -- Q-bit array (обс.) 20:48, 27 марта 2018 (UTC)
- Дополнение: В обсуждении было высказано обоснованное замечание, что проверять первую правку не всегда имеет смысл, так как статьи редко создаются одной правкой. Кроме того, заметил, что в отчёте бота присутствует очень много статей, которые были удалены. Какой смысл проверять откровенно КБУшные статьи, которые исчезнут через 5-10 минут? Поэтому хочу предложить элегантное решение сразу обеих проблем — проверять не первую правку статьи, а выждать некоторое время (например сутки) и проверить последнюю правку. За сутки статья обычно или доводится до ума или удаляется. Это позволит улучшить процент обнаружения копивио и снизить нагрузку на сервис проверки как минимум в два раза. -- Q-bit array (обс.) 21:03, 27 марта 2018 (UTC)
- Окей, будем исправлять. OlegCinema (обс.) 12:47, 1 апреля 2018 (UTC)
- Обновил скрипт. Добавил часовой диапазон, проверять статьи только возрастом от 24 до 25 часов. Так уже не будет сырая, и в то же время её не успеют срепостить на другие сайты. Спасибо за идею. По поводу ссылок на версию статьи на сервисе проверки. Хотя можно добавить в таблицу две ссылки, на проверенную и текущую версии. Но мне кажется они не нужны, ведь патрулирующие будут судить по текущей ситуации статьи, не имеет значения что там было когда-то и уже исправлено. Кроме того, чтобы узнать версию правки нужны дополнительные запросы, больше запросов к разным сайтам — выше риски глюков. --Vladis13 (обс.) 23:46, 4 апреля 2018 (UTC)
Предварительный итог
правитьПо итогам обсуждения у бюрократов сложился следующий консенсус: мы готовы присвоить флаг бота, однако ответственным ботоводом должен быть только участник Vladis13, поскольку именно он обладает техническими знаниями, необходимыми для работы правильной бота. Участнику OlegCinema это не помешает заниматься организационной работой, однако он не должен иметь технической возможности совершать правки с аккаунта бота. Если возражений на такое решение не последует, то флаг будет присвоен.--Vladimir Solovjev обс 16:44, 10 апреля 2018 (UTC)
- Присваивайте, однако вот это поскольку именно он обладает техническими знаниями, необходимыми для работы правильной бота я считаю ошибочный мнением. он не должен иметь технической возможности совершать правки с аккаунта бота — это что-то вроде недоверия и опасения что я буду совершать вандальные правки с аккаунта бота? OlegCinema (обс.) 10:16, 11 апреля 2018 (UTC)
- Никто не собирается обвинять вас в том, что вы собираетесь совершать вандальные правки. Просто ботовод должен обладать определенными техническими знаниями, поскольку в случае ошибки последствия могут быть достаточно серьёзными. В данном случае мы считаем, что ботоводом должен быть тот участник, который бота писал, поскольку если что-то пойдёт не так, то только он может достаточно быстро всё поправить. Даже для хорошего программиста разобраться в чужой программе не так просто.--Vladimir Solovjev обс 22:33, 13 апреля 2018 (UTC)
- По кругу опять идём. Вы обсуждение читали, Владимир? OlegCinema (обс.) 08:12, 21 апреля 2018 (UTC)
- Никто не собирается обвинять вас в том, что вы собираетесь совершать вандальные правки. Просто ботовод должен обладать определенными техническими знаниями, поскольку в случае ошибки последствия могут быть достаточно серьёзными. В данном случае мы считаем, что ботоводом должен быть тот участник, который бота писал, поскольку если что-то пойдёт не так, то только он может достаточно быстро всё поправить. Даже для хорошего программиста разобраться в чужой программе не так просто.--Vladimir Solovjev обс 22:33, 13 апреля 2018 (UTC)
- Небольшой комментарий в сторону. Хоть я и не великий знаток английского языка, но порядок слов в имени бота мне не очень нравится. Поэтому предлагаю его переименовать в "CopyvioCheckingBot", "CopyvioChecker" или ещё как-нибудь, но в соответствии с правилами английского языка. --Emaus (обс.) 11:04, 11 апреля 2018 (UTC)
- Бот был так назван совсем не для перевода с английского, а для лёгкого запоминания. Нынешний порядок слов хоть и граматически неправелен, но он лёгко запоминается, а русскому человеку, не знающему английский язык, будет легко понять что он делает. OlegCinema (обс.) 11:09, 11 апреля 2018 (UTC)
- Насчёт лёгкого запоминания - для знающего английский язык будет сложнее, так-как сбивает с толку. Для незнающего - лучше название прямо на русском языке. --Emaus (обс.) 11:49, 11 апреля 2018 (UTC)
- Название на русском языке не сильно подходит для бота... OlegCinema (обс.) 12:02, 11 апреля 2018 (UTC)
- CheckerOfCopyvioBot имеет тот же порядок и грамматически правилен. Bsivko (обс.) 19:37, 1 мая 2018 (UTC)
- Насчёт лёгкого запоминания - для знающего английский язык будет сложнее, так-как сбивает с толку. Для незнающего - лучше название прямо на русском языке. --Emaus (обс.) 11:49, 11 апреля 2018 (UTC)
- Бот был так назван совсем не для перевода с английского, а для лёгкого запоминания. Нынешний порядок слов хоть и граматически неправелен, но он лёгко запоминается, а русскому человеку, не знающему английский язык, будет легко понять что он делает. OlegCinema (обс.) 11:09, 11 апреля 2018 (UTC)
- Сделано Переименовано в "CopyvioCheckerBot". --Vladis13 (обс.) 16:22, 23 июня 2018 (UTC)
Итог
правитьВсё никак у бюрократов не доходили руки обсудить итог, но заявку закрывать надо. Поскольку за прошедшее время уровень доверия к участнику OlegCinema вырос (что вылилось в получение им флага ПИ), то у бюрократов больше нет оснований ограничивать доступ участника к боту. Соответственно, флаг бота присвоен, а участники OlegCinema и Vladis13 пусть сами договариваются, кто и за что отвечают. Только учтите замечания, высказанные в обсуждении.--Vladimir Solovjev обс 19:03, 4 июля 2018 (UTC)
OlegBot
править- OlegBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод: OlegCinema
Цель
правитьБота планирую использовать для выполнения заявок на ВП:РДБ. Кроме этого, бот будет использовать специальный скрипт для помощи патрулирующим на странице запроса. Вот собственно сам скрипт [12]. Простыми словами, бот будет отмечать на ВП:ЗКП и ВП:ЗКПАУ тему, которая уже отпатрулирована. Отличие от других ботов то, что имею собственный VDS, поэтому бот будет работать в круглосуточном режиме, а самое главное довольно быстро, чем не могут похвастаться другие подобные боты (к стати о них: основной бот, выполняющий это, уже не правит с 9 января), это одна из причин, натолкнувшая меня на это. Была неудачная попытка теста бота, поэтому проводить тестовые правки буду только тогда, когда мне здесь разрешат это делать, чтобы не было более проблем (думаю, это понятно, что в личном пространстве это сделать довольно таки трудно). Скрипт работает на PyWikiBot, также готов показать умение работать с ним. В будущем планирую написать скрипт, который будет проверять источники (ссылки). Не смотря на то, что такой бот есть, мне кажется не помешало бы ещё одного, а может и нескольких. Работать будет в полуавтоматическом режиме
Технические подробности
правитьНаписан на фреймворке PyWikiBot, соответственно там же работает. Язык — Python. Исходный код [13].
Имеется флаг бота в других разделах Википедии?
правитьВ данный момент не имеется.
-- OlegCinema (обс.) 16:47, 13 января 2018 (UTC)
Обсуждение (OlegBot)
править- «думаю, это понятно, что в личном пространстве это сделать довольно таки трудно» нет, не понятно. Почему нельзя тестировать итогоподведнние в ЛП? -- dima_st_bk 02:10, 14 января 2018 (UTC)
- У меня нет статус патрулирующего, придётся привлекать других участников. Но, если вы готовы помочь, то я с удовольствием протестирую его. --OlegCinema (обс.) 02:45, 14 января 2018 (UTC)
- А зачем для тестов флаг ПАТ? -- dima_st_bk 03:45, 14 января 2018 (UTC)
- Чтобы проверили статью, и бот её вычеркнул. --OlegCinema (обс.) 03:54, 14 января 2018 (UTC)
- Что мешает на тестовой странице вставить ссылки на уже отпарулированные страницы? -- dima_st_bk 04:16, 14 января 2018 (UTC)
- @dima_st_bk: Охх, ну вот Участник:OlegCinema/Братишка бот. --OlegCinema (обс.) 04:59, 14 января 2018 (UTC)
- Что мешает на тестовой странице вставить ссылки на уже отпарулированные страницы? -- dima_st_bk 04:16, 14 января 2018 (UTC)
- Чтобы проверили статью, и бот её вычеркнул. --OlegCinema (обс.) 03:54, 14 января 2018 (UTC)
- А зачем для тестов флаг ПАТ? -- dima_st_bk 03:45, 14 января 2018 (UTC)
- У меня нет статус патрулирующего, придётся привлекать других участников. Но, если вы готовы помочь, то я с удовольствием протестирую его. --OlegCinema (обс.) 02:45, 14 января 2018 (UTC)
- «имею собственный VDS» — странное "отличие". Не говоря уж о том, что ваш VDS по скорости доступа всё равно не сравнится с Лабсом.--Iluvatar обс 12:39, 14 января 2018 (UTC)
- @Iluvatar: Я не знаю кто это такой; очевидно он не использует вышеприведенных скрипт. По скорости я имел в виду именно зону ответственности моего бота, а не другие задачи. Многие ставят бота на специальные сайты, специализированные для них, а там, между прочем, есть ограничения тоже. --OlegCinema (обс.) 16:04, 14 января 2018 (UTC)
- https://tools.wmflabs.org/ -- dima_st_bk 10:01, 15 января 2018 (UTC)
- и вот ещё есть: https://paws.wmflabs.org/ . Это как раз и том, о чём я говорил. В любом случае, собственная машинка безопаснее. --OlegCinema (обс.) 12:53, 15 января 2018 (UTC)
- https://tools.wmflabs.org/ -- dima_st_bk 10:01, 15 января 2018 (UTC)
- @Iluvatar: Я не знаю кто это такой; очевидно он не использует вышеприведенных скрипт. По скорости я имел в виду именно зону ответственности моего бота, а не другие задачи. Многие ставят бота на специальные сайты, специализированные для них, а там, между прочем, есть ограничения тоже. --OlegCinema (обс.) 16:04, 14 января 2018 (UTC)
- Участник зарегистрировался меньше 30 декабря и через полмесяца подаёт заявку на бота. Судя по первой правке, у участника уже есть опыт работы в Википедии, так что это вряд ли первая учётная запись. Так что в настоящее у меня есть серьёзные сомнения в необходимости присвоения статуса бота, поскольку к ботоводу должен быть определённый уровень доверия, которого пока нет.--Vladimir Solovjev обс 18:25, 15 января 2018 (UTC)
- Имел дело с Википедией давно, но то было анонимно с IP. Готов проверится добровольно на наличие кукол, или как вы их называете "виртуалов". Мне это труда не составляет, если вдруг это повысит Ваш уровень доверия. --OlegCinema (обс.) 03:17, 16 января 2018 (UTC)
- Я поддерживаю. DENAMAX (обс.) 20:01, 23 января 2018 (UTC)
- @Коллега, DENAMAX:, а что именно поддерживаете? --OlegCinema (обс.) 15:24, 24 января 2018 (UTC)
- Чтобы дали статус бота. DENAMAX (обс.) 19:38, 24 января 2018 (UTC)
- @Коллега, DENAMAX:, а что именно поддерживаете? --OlegCinema (обс.) 15:24, 24 января 2018 (UTC)
- Я поддерживаю. DENAMAX (обс.) 20:01, 23 января 2018 (UTC)
- Имел дело с Википедией давно, но то было анонимно с IP. Готов проверится добровольно на наличие кукол, или как вы их называете "виртуалов". Мне это труда не составляет, если вдруг это повысит Ваш уровень доверия. --OlegCinema (обс.) 03:17, 16 января 2018 (UTC)
- Прошу снять заявку на статус бота по личному желанию. --OlegCinema (обс.) 14:35, 9 февраля 2018 (UTC)
Итог
правитьЗакрыто по просьбе участника [14]. -- dima_st_bk 23:11, 9 февраля 2018 (UTC)
NoteDanielBot
править- NoteDanielBot (обс. · вклад · удалённый вклад · статьи · файлы · инфо · журналы · фильтры · блокировки · права)
Ответственный ботовод/Botmaster: Участник:NoteDaniel
Цель
правитьДанный бот работает в полуручном режиме для редактирования ошибок в коде или в написании.
Технические подробности
правитьИмеется флаг бота в других разделах Википедии?
правитьЭто первый бот -- NoteDanielBot (обс.) 15:38, 6 января 2018 (UTC)
Обсуждение (NoteDanielBot)
править- Вижу существенные проблемы у этой заявки — сразу несколько. Для получения статуса бота нужно указать, какие задачи будет выполнять бот и сделать несколько тестовых правок для демонстрации. Важно учесть, что на выполнение задач должно быть одобрение общества. Не всё, что технически возможно, действительно следует автоматизировать. Кроме того, обычно ботоводами становятся участники, набравшиеся опыта в проекте, знакомые с правилами (и имеющие хотя бы флаг АПАТ). Владелец бота NoteDaniel зарегистрировался всего три дня назад. Я бы посоветовал сначала набраться опыта, разобраться, какие задачи можно (и нужно) автоматизировать, разработать соответствующего бота, продемонстрировать его, а только потом подать заявку. -- Q-bit array (обс.) 15:54, 6 января 2018 (UTC)
- @NoteDaniel: На всякий случай предупрежу, о том что у нас уже был такой бот меняющий ссылки http на https, и всё закончилось бессрочной блокировкой данного бота. — Ping08 обс. 16:22, 6 января 2018 (UTC)
- спасибо--NoteDaniel (обс.) 16:25, 6 января 2018 (UTC)
- Боту получилось найти страницу сироту
- Это какая-то шутка? Помимо отсутствия АПАТ у ботовода и не озвученного круга задач (и принципа работы), так у бота нет вообще ни одной нормальной правки — все подверглись пост-коррекции.--Iluvatar обс 14:55, 12 января 2018 (UTC)
Итог
правитьОтказано по аргументам коллег. При подаче повторной заявки прошу приводить конкретные примеры работы бота над заявляемыми целями: задача ХХХ, сделано <линк>, фрагмент кода бота <YYY>. Lazyhawk (обс.) 20:32, 27 февраля 2018 (UTC)