Як зробити PDF доступним — інструкція
PDF — найпоширеніший формат документів у державному секторі, бізнесі та освіті. Законодавства, звіти, договори, форми — все це часто публікується як PDF. Проблема: більшість PDF в Україні повністю недоступні для скрін-рідерів і людей з порушеннями зору.
Недоступний PDF — це відсканований папір у вигляді зображення, де немає жодного тексту, який скрін-рідер міг би прочитати. Навіть якщо ви "бачите" текст — це може бути просто картинка.
Доступний PDF (Tagged PDF) — документ зі структурою тегів, де кожен елемент (заголовок, абзац, список, таблиця, зображення) має семантичне позначення.
Факт: ДСТУ EN 301 549 вимагає доступності PDF-документів поряд з вебсайтами. Державні органи зобов'язані публікувати документи у Tagged PDF.
Чому більшість PDF недоступні?
Тип 1: Сканований PDF Паперовий документ відсканований у PDF. Це просто зображення тексту. Скрін-рідер не "бачить" нічого.
Тип 2: Нетегований PDF Створений у Word або інших програмах, але збережений без тегів. Текст є, але немає структури — скрін-рідер читає все поспіль без розуміння заголовків, списків, таблиць.
Тип 3: Tagged PDF ✅ Правильно структурований PDF з тегами. Скрін-рідер розуміє ієрархію, порядок читання, альтернативні тексти.
Як створити доступний PDF з Microsoft Word
Найпростіший спосіб — правильно оформити документ у Word, а потім зберегти як Tagged PDF.
Крок 1: Правильна структура у Word
✅ Правила форматування для доступного PDF:
- Використовуйте стилі заголовків: "Заголовок 1", "Заголовок 2"
(не просто жирний текст або збільшений шрифт)
- Списки через кнопки списків Word (не дефіси вручну)
- Таблиці через Insert → Table (не сітки з пробілів)
- Зображення з Alt Text (правий клік → Edit Alt Text)
Стилі заголовків у Word:
- Виділіть текст
- Home → Styles → "Заголовок 1" / "Заголовок 2"
- Ці стилі автоматично перетворяться на теги
<H1>,<H2>у PDF
Крок 2: Alt-тексти для зображень у Word
- Правий клік на зображення
- "Edit Alt Text..."
- Введіть опис зображення
- Або позначте "Mark as decorative" для декоративних
Крок 3: Збереження як Tagged PDF
File → Save As → PDF:
Важливо: натисніть "Options..." перед збереженням:
- ✅ "Document structure tags for accessibility" — обов'язково увімкнути
- ✅ "Create bookmarks using Headings"
- ✅ "Document properties"
Якщо збережете без "Document structure tags" — отримаєте нетегований PDF.
Як перевірити доступність PDF
Безкоштовно — PAC 2024 (PDF Accessibility Checker)
PAC від Access For All — безкоштовний інструмент для Windows:
- Завантажте з pdfua.foundation
- Відкрийте PDF
- Запустіть перевірку
- Перегляньте звіт: помилки та попередження за категоріями
PAC перевіряє:
- Наявність тегів (Tagged PDF)
- Порядок читання
- Alt-тексти для зображень
- Теги таблиць
- Мову документа
- Закладки (bookmarks)
Adobe Acrobat Pro — Accessibility Checker
Якщо є Adobe Acrobat Pro:
- Tools → Accessibility → Full Check
- Звіт покаже всі проблеми з посиланнями на виправлення
- Tools → Accessibility → Fix Reading Order — для виправлення порядку читання
Безкоштовна онлайн-перевірка
Завантажте PDF на pdfua.foundation → онлайн-перевірка базових критеріїв PDF/UA.
Найпоширеніші проблеми PDF та як виправити
1. Відсутні теги (нетегований PDF)
Симптом: PAC показує "PDF is not tagged" Причина: Збережено без "Document structure tags" Виправлення: Пересзберіть з Word з увімкненою опцією або додайте теги в Acrobat: Tools → Accessibility → Add Tags to Document
2. Зображення без Alt Text
Симптом: PAC → "Figure has no alt text" Виправлення в Acrobat:
- Tools → Accessibility → Reading Order
- Правий клік на зображення → Edit Alternate Text
3. Невірний порядок читання
Симптом: Скрін-рідер читає колонки неправильно (ліва+права перемішані) Виправлення: Acrobat → Tools → Accessibility → Fix Reading Order → перетягніть елементи в правильному порядку
4. Таблиці без заголовків
Симптом: PAC → "Table header cell not marked" Виправлення в Acrobat:
- Tools → Accessibility → Reading Order
- Виділіть комірки заголовку таблиці
- Кнопка "Table Header Cell"
5. Сканований PDF (зображення замість тексту)
Найскладніший випадок. Потрібне OCR (розпізнавання тексту):
Acrobat Pro:
- Tools → Enhance Scans → Recognize Text
- Виберіть мову: Ukrainian
- Запустіть розпізнавання
Безкоштовно:
- Adobe Acrobat Online (обмежено)
- FreeOCR
- Tesseract (відкритий, командний рядок)
Після OCR — обов'язково перевірте якість розпізнавання і додайте теги.
Мінімальні вимоги для доступного PDF
Критерії PDF/UA (ISO 14289-1):
- Документ Tagged (теги наявні)
- Мова документа визначена
- Заголовки використовують теги H1-H6
- Зображення мають Alt Text або marked as artifact
- Таблиці мають заголовкові комірки (
<TH>) - Закладки для навігації (для документів 20+ сторінок)
- Порядок читання логічний
- Форми мають підписи (для PDF-форм)
Практичне правило: якщо документ створений у Word зі стилями заголовків + збережений з тегами → 80% вимог виконано автоматично.
Порада для держорганів та великих організацій
Якщо ви публікуєте багато PDF-документів регулярно:
- Налаштуйте шаблони з правильними стилями в Word — 1 раз виправили, всі нові документи доступні автоматично
- Навчіть команду зберігати PDF правильно (5 хвилин інструктажу)
- Включіть перевірку PAC у процес публікації
- Застосуйте Acrobat Action — автоматична перевірка + виправлення типових помилок у пакетному режимі