تنظيم النصوص بعد الفعالية
تنظيف وتوزيع النصوص متعددة اللغات بحيث يكون المستند ما بعد الفعالية موثوقاً تحت التدقيق.
النص الخام من Loquira يلتقط كل كلمة تعرف عليها محرك الكلام: جمل كاملة، أجزاء جمل، بدايات خاطئة، كلمات حشو متكررة، وآثار التداخل الصوتي. إنه سجل دقيق لما سمعه المحرك. لكنه ليس مستنداً قابلاً للنشر.
يغطي هذا الدليل عملية التنظيم — الحد الأدنى من التنظيف الذي يحوّل النص الخام إلى مستند مناسب للتوزيع والاقتباس والأرشفة.
الحد الأدنى من التنظيف
يجب أن يجتاز النص المنظّم ثلاثة اختبارات:
- يمكن للقارئ تحديد من قال ماذا.
- النص يتدفق كنثر مكتوب، وليس ككلام متقطع.
- لا توجد مواد حساسة في النسخة الموزعة.
الخطوة 1: نسب الكلام للمتحدثين. النص الخام يسجل الأقوال كتيار واحد. إذا كان هناك عدة متحدثين نشطين، أضف تسمية المتحدث عند أول قول لكل متحدث وعندما يتغير المتحدث. استخدم اسم المتحدث أو دوره: “ألينا نوفاك (الرئيس التنفيذي):” أو “المُيسّر:”. للمؤتمرات الصحفية، حدد الصحفيين باسم المنشأة إذا تم منح الإذن: “سؤال — Le Monde:”.
الخطوة 2: فواصل الفقرات والبنية. يصل النص الخام ككتلة من المقاطع الموقوتة. أدخل فواصل الفقرات عند انتقالات الموضوع الطبيعية. إذا كان جدول أعمال الأمسية غطى ثلاثة مواضيع، يجب أن يحتوي النص على ثلاثة أقسام. أضف تعليقات توضيحية بين قوسين مربعين لتحولات الموضوع: “[الانتقال إلى الأسئلة والأجوبة]”.
الخطوة 3: تنظيف اضطرابات الكلام. أزل كلمات الحشو المتكررة (أم، آه، كما تعلم، مثل، نوعاً ما). محرك الكلام يعيد إنتاج كل قول بأمانة بما في ذلك هذه. النسخة المنظّمة تخدم القارئ بشكل أفضل بحذفها. لا تصحح القواعد، ولا تعيد صياغة الجمل، ولا تغير معنى المتحدث. النص هو سجل، وليس إعادة كتابة.
التوفيق بين النصوص المترجمة والنص الأصلي
عندما كانت الجلسة تحتوي على عدة لغات إخراج نشطة، كل نص لغة هو تجسيد مستقل للكلام الأصلي. الترجمة العكسية المباشرة للنص الفرنسي إلى الإنجليزية لن تطابق النص الإنجليزي الأصلي كلمة بكلمة — الترجمة تُحدث اختلافاً مشروعاً في الصياغة، ومعالجة التعابير الاصطلاحية، وبنية الجملة.
كيفية التوفيق للتوزيع:
- وزّع نص اللغة الأصولية كالنسخة المعتمدة.
- وزّع كل نص مترجم بجانبه، مع وصف واضح: “الترجمة الفرنسية (منشأة آلياً)”.
- لا تحاول التوفيق يدوياً بين الترجمات والأصل. الاختلاف متأصل في عملية الترجمة ولا يشير إلى أخطاء.
إذا كان مقطع معين يجب أن يكون متطابقاً عبر جميع إصدارات اللغة — بيان سياسة، إخلاء مسؤولية قانوني، اقتباس رئيسي — تحقق من ترجمة ذلك المقطع بشكل منفصل وأضف تعليقاً توضيحياً على النص إذا لزم الأمر. هذا نادر لمعظم حالات الاستخدام لكنه ضروري للسياقات التنظيمية أو الامتثال.
التنقيح للمواد الحساسة
قبل توزيع النص خارجياً، راجعه بحثاً عن محتوى حساس لا ينبغي أن يظهر في النسخة المنشورة.
ما الذي تبحث عنه:
- معلومات تعريف شخصية (أرقام هواتف، عناوين بريد إلكتروني، عناوين منازل) قيلت أثناء الفعالية. محرك الكلام يلتقط هذه بدقة.
- تصريحات خارج السجل قيلت خلال أجزاء داخل السجل. قد ينتقل المتحدث من داخل السجل إلى خارج السجل في منتصف الجملة.
- تصريحات تطلعية حساسة تجارياً تمت الموافقة عليها للغرفة ولكن ليس للتوزيع الخارجي.
طريقة التنقيح: استبدل المقطع الحساس بوصف بين قوسين: “[تم التنقيح — حساس تجارياً]” أو “[تمت إزالة المعلومات الشخصية]”. لا تستخدم النص الخام كدليل على التنقيح؛ النص في نفس الموضع. أنشئ ملفاً منقحاً منفصلاً.
اتفاقيات الأرشفة للسجلات طويلة الأمد
المؤسسات التي تدير جلسات Loquira أسبوعياً أو شهرياً تراكم أرشيف نصوص. بدون اتفاقيات تسمية، يصبح الأرشيف غير قابل للاستخدام في غضون بضعة أرباع.
هيكل الأرشفة الموصى به:
/transcripts/
YYYY/
YYYY-MM-DD_event-name/
YYYY-MM-DD_event-name_ar.txt
YYYY-MM-DD_event-name_fr.txt
YYYY-MM-DD_event-name_ja.txt
YYYY-MM-DD_event-name_metadata.json
ملف JSON الوصفي يخزن معلومات على مستوى الجلسة: اسم المتحدث، نوع الفعالية، المدة، عدد المستمعين لكل لغة، وأي ملاحظات من المنظّم (مثل “جزء الأسئلة والأجوبة مفقود — كان الميكروفون مغلقاً أثناء الأسئلة والأجوبة”).
قرارات الاحتفاظ لكل فعالية:
ليست كل نص بحاجة إلى الاحتفاظ به إلى أجل غير مسمى. حدد فئة احتفاظ لكل نوع فعالية:
| نوع الفعالية | الاحتفاظ | مثال |
|---|---|---|
| اجتماعات مجلس الإدارة | دائم | اجتماع المساهمين السنوي |
| اجتماعات عامة داخلية | سنتان | الاجتماع الربعي |
| مؤتمرات صحفية | سنة واحدة | إطلاق منتج |
| اجتماعات أسبوعية | 90 يوماً | مزامنة الهندسة |
| جلسات اختبار | 30 يوماً | تجربة قبل فعالية |
طبق الاحتفاظ على مستوى الأرشيف، وليس لكل ملف. يمكن لبرنامج نصي يتحقق من تواريخ إنشاء المجلدات مقابل سياسة الاحتفاظ أتمتة التنظيف.