L2-05 — Поиск в десятке файлов¶
практик
У тебя где-то 200 договоров. В каких из них пеня больше 0,5%? Удачи.
Раньше эта задача стоила недели работы помощника: открыть каждый файл, найти пункт про пеню, выписать в табличку. К концу третьего дня помощник ненавидит свою жизнь, к концу пятого ты ему уже не доверяешь.
Claude делает то же самое за несколько минут — и не устаёт. Это тот момент, когда «папка с документами» из груды файлов превращается в рабочую базу, которую можно спрашивать.
Этот урок — про самый мощный приём в работе с офисными документами.
Разминка, не подглядывая: Claude сравнивает две версии договора по буквам или по смыслу?
Чем это отличается от обычного поиска¶
В Windows ты привык искать по имени файла или по точному слову. Это работает, но плохо.
Поиск Windows ищет буквы. Запрос «пеня» найдёт документы, где есть слово «пеня». Не найдёт документы, где написано «неустойка», «штраф», «штрафные санкции» — а это про то же самое.
Поиск Claude ищет смысл. Запрос «найди все договоры, где предусмотрена пеня за просрочку оплаты» найдёт и «пеню», и «неустойку», и «штрафные санкции», и «проценты за просрочку». Потому что для него это всё — одна тема.
И — критическое отличие — он понимает условия. Не просто «найди где есть пеня», а «найди договоры, где пеня превышает 0,3% в день» — справится. Откроет, прочитает, сравнит число, отберёт.
Простой поиск по теме¶
Самый базовый случай — найти, где вообще упоминается какая-то тема.
В рабочей папке лежат 30 договоров. Запрос:
«Найди в этой папке все договоры, где упоминается персональная ответственность руководителя. Перечисли: имя файла, номер пункта, краткая выдержка.»
Через 30 секунд — список из 7 файлов с указанием, где именно про это написано. Можешь открыть каждый и проверить.
Полезно сразу попросить в виде таблицы: имя файла, контрагент, номер пункта, выдержка. Тогда результат сразу пригоден для отчёта.
Поиск по числовому условию¶
Здесь начинается магия. Раньше такие задачи решались только глазами.
«Найди в папке договоры, где сумма сделки больше 1 миллиона рублей.»
«В каких договорах гарантийный срок меньше 12 месяцев?»
«Где пеня за просрочку оплаты превышает 0,3% в день?»
«Найди акты, где сумма НДС не сходится с суммой без НДС × 0,2 — с расхождением больше 10 рублей.»
Это и есть та самая работа, которую обычно поручают младшим: «пробегись по всем актам, найди расхождения». Теперь — одно предложение, минута, ответ.
Поиск по комбинации условий¶
Самое полезное — несколько условий сразу.
«Найди договоры, где: 1) контрагент находится не в России, 2) подсудность — российский суд, 3) сумма больше 500 тысяч. Сделай таблицу.»
«В папке "должностные" — найди все инструкции, где: 1) упомянута материальная ответственность, 2) сотрудник имеет доступ к денежным средствам, 3) нет пункта о ежегодной инвентаризации. Это потенциальные дыры в кадровой политике.»
Каждое такое условие отдельной строкой — Claude понимает их как фильтры. На выходе — узкий, точный список.
Это уже не поиск. Это аналитика на корпусе документов, которая стоила бы месяца работы аналитика.
Вытащить структурированные данные¶
Кроме поиска, Claude умеет вытаскивать данные из всех файлов в таблицу. Это смежная тема (подробнее в L2-06), но в поиске она часто нужна.
«Из всех договоров в папке вытащи: имя файла, контрагент (полное наименование), ИНН, сумма с НДС, срок действия, наличие пункта о пене (да/нет, какая ставка). Выгрузи в Excel "сводная.xlsx".»
50 договоров → 50-строчная таблица за пару минут. Дальше её сортируешь, фильтруешь, отдаёшь руководителю.
Скорость и масштаб¶
Реальные цифры с моих папок.
10–30 файлов — отвечает за 20–40 секунд. Можно использовать как обычный поиск, многократно за час.
50–100 файлов — минута-полторы. Уже чувствуется, что он «думает», но всё равно быстрее, чем самому открывать.
200–500 файлов — несколько минут. На этом масштабе уже имеет смысл писать запрос тщательно: один запрос — много пользы, а не «дай посмотрю, и потом ещё раз дай посмотрю».
Больше 500 файлов — техническая возможность есть, но удобнее делить папку на подгруппы (по годам, по контрагентам, по типу документов). Так и быстрее, и точнее.
Кейс — 60 договоров и пеня выше нормы¶
Когда я переходил в новый отдел, мне досталась папка «договоры-действующие» — 64 файла, разные годы, разные контрагенты. Задача от руководителя: «понять, где у нас слабые места по штрафным санкциям».
Раньше — неделя работы. Открыть каждый, найти пункт про неустойку, выписать. К концу недели часть забудешь, часть перепутаешь.
В этот раз — положил папку в VS Code, открыл Claude, попросил:
«В папке "договоры-действующие" — 64 договора с контрагентами. Для каждого договора найди пункт про пеню/неустойку за просрочку (любых обязательств — оплаты, поставки, выполнения работ). Выведи таблицу: имя файла, контрагент, тип просрочки, ставка пени (в % в день), пункт договора. Если пени нет — пиши "не предусмотрена".»
Через 3 минуты — таблица из 64 строк. Из них:
- В 11 договорах пеня выше 0,5% в день (это много, обычная норма — 0,1%)
- В 7 договорах пени нет вообще (это уязвимость — контрагент может тянуть)
- В одном договоре пеня была 1% в день, причём в нашу пользу — мы давно про неё забыли, контрагент уже четвёртый месяц должен
Этот один пункт, который я бы не нашёл руками, оправдал недельный поиск. Руководителю отправил таблицу и три предложения: где переподписывать, где требовать оплату, где спокойно.
Ответ через час: «давай переподпишем эти 11 + взыщем с того поставщика. Хорошая работа.»
Хорошая работа — три минуты.
Когда поиск работает хуже¶
Сканы плохого качества. Если папка состоит из сканов разных лет с пожелтевшими страницами — точность падает. Сначала распознай (см. L2-01), потом ищи.
Слишком разные форматы. Если в папке вперемешку Word, Excel, PDF, презентации — Claude разберётся, но скажет: «в Excel я искал так, в PDF так, обрати внимание». На больших таких папках лучше делить по форматам.
Неоднозначные запросы. «Найди важные договоры» — без критерия «важности» Claude угадает, может ошибиться. Лучше: «найди договоры, где сумма больше 1 млн ИЛИ срок действия дольше 3 лет».
Папки с мусором. Если в папке кроме рабочих документов лежат презентации, скриншоты, заметки — Claude добросовестно прочитает всё. Чистая папка — точнее поиск. Это к L1-05 про принцип «одна папка — одна задача».
Бояться нечего¶
Файлы остаются на месте. Поиск — это чтение. Никаких изменений в исходниках без отдельного разрешения и предпросмотра.
Содержимое не уходит наружу. Документы обрабатываются на серверах Anthropic, но не сохраняются и не используются для обучения (Pro). Подробно — L4-01.
Точность на корпусе договоров — высокая. Я сверял первые свои поисковые таблицы с реальностью — пропусков почти не было. Бывают мелкие неточности в выдержках (Claude чуть переформулировал) — но это видно при проверке.
На критических задачах перепроверяй. Если от поиска зависит судебное решение или большая сумма — выдели топ-10 находок и открой исходники глазами. На остальном — обычная производственная задача с обычной точностью.
Что попробовать прямо сегодня¶
Это упражнение показывает другому человеку, что такое Claude в офисе. Если хочешь убедить коллегу — сделай это вместе с ним.
- Возьми папку с однотипными документами на работе: договоры, акты, должностные инструкции, регламенты, выписки
- Если папки нет — собери из почты или с диска штук 10–15 файлов одного типа в новую папку
- Открой папку в VS Code, запусти Claude
- Задай рабочий поисковый вопрос, который реально интересен: например, «найди договоры, где гарантийный срок меньше 12 месяцев» или «найди акты, где сумма больше 100 тысяч и нет подписи получателя»
- Сверь с тем, что ожидал найти
Если в результате окажется что-то, чего ты не знал про свою же папку — поздравляю, ты только что увидел силу.
Что дальше¶
Поиск нашёл нужные файлы. А что если из всех нужных файлов вытащить данные в одну таблицу — реквизиты, суммы, сроки? Раньше для этого был сидячий день с копированием.
В следующем уроке — извлечение данных в таблицу. Кейс: 30 актов сверки → готовая таблица для бухгалтерии. То, ради чего родится много завистливых взглядов в твою сторону.
А у тебя сейчас есть папка с документами, где ты сам не помнишь, что внутри? Сколько там примерно файлов?