تاريخ النشر: 6 يوليو 2026

تصنيف النصوص في الذكاء الاصطناعي: الدليل الكامل 2026

جلسة استشارية مجانية في مجال الذكاء الاصطناعي

احصل على تقدير مجاني للخدمة

أخبرنا عن مشروعك - وسنتصل بك بعرض سعر مخصص

ملخص سريع: يُعدّ تصنيف النصوص في الذكاء الاصطناعي تقنيةً لمعالجة اللغة الطبيعية، حيث تُسند تلقائيًا فئات أو تصنيفات مُحددة مسبقًا إلى البيانات النصية. تُحلل نماذج التعلّم الآلي والتعلّم العميق المحتوى النصي لفرز المستندات ورسائل البريد الإلكتروني ومنشورات وسائل التواصل الاجتماعي وآراء العملاء في مجموعات مُنظمة، مما يُمكّن الشركات من معالجة كميات كبيرة من النصوص غير المُهيكلة بكفاءة واستخلاص رؤى قابلة للتنفيذ.

في كل دقيقة، تصل ملايين الرسائل الإلكترونية إلى صناديق البريد الوارد. وتغمر منشورات وسائل التواصل الاجتماعي المنصات. وتتراكم تقييمات العملاء بوتيرة أسرع من قدرة أي فريق بشري على قراءتها.

يُعالج تصنيف النصوص في الذكاء الاصطناعي هذه المشكلة من خلال فرز النصوص تلقائيًا إلى فئات ذات دلالة. وهي التقنية التي تقف وراء فلاتر البريد العشوائي، ومحللات المشاعر، وأنظمة كشف نوايا برامج الدردشة الآلية، وأنظمة مراقبة المحتوى.

لكن كيف يتعلم الذكاء الاصطناعي تصنيف النصوص فعلياً؟ وما الذي يجعل أساليب التعلم العميق الحديثة أكثر فعالية بكثير من الأساليب السابقة؟

ما هو تصنيف النصوص؟

تصنيف النصوص هو عملية إسناد فئات أو تصنيفات محددة مسبقًا إلى البيانات النصية. وباعتباره مهمة أساسية في معالجة اللغات الطبيعية، فإنه يحول المعلومات النصية الخام إلى مجموعات منظمة ومهيكلة يمكن للآلات معالجتها وتحليلها.

الهدف واضح ومباشر: أخذ نص - مستند، جملة، فقرة، أو تغريدة - وتحديد الفئة التي ينتمي إليها تلقائيًا. قد تكون هذه الفئة "بريد مزعج" مقابل "ليس بريدًا مزعجًا"، أو "إيجابيًا" مقابل "سلبيًا"، أو واحدة من عشرات تصنيفات المواضيع مثل "الرياضة" أو "السياسة" أو "التكنولوجيا".“

على عكس القراءة البشرية التي تعتمد على السياق والخبرة، يستخدم تصنيف النصوص بواسطة الذكاء الاصطناعي أنماطًا رياضية مستمدة من بيانات التدريب. تحدد نماذج التعلم الآلي السمات الموجودة في النص - مثل ترددات الكلمات، وبنية الجمل، والعلاقات الدلالية - وتربطها بتصنيفات محددة.

كيف يختلف عن مهام معالجة اللغة الطبيعية الأخرى

يندرج تصنيف النصوص ضمن عائلة أوسع من تقنيات معالجة اللغة الطبيعية، ولكنه يختلف عن مهام مثل التعرف على الكيانات المسماة (التي تحدد كيانات معينة) أو الترجمة الآلية (التي تحول النص بين اللغات).

ما هو الفرق الرئيسي؟ التصنيف يخصص تسميات منفصلة لأجزاء النص بأكملها، بدلاً من استخراج المعلومات من داخل النص أو تحويلها إلى شيء آخر.

لماذا يُعدّ تصنيف النصوص مهمًا في الذكاء الاصطناعي؟

تتعامل الشركات والمنصات مع كميات متزايدة بشكل هائل من النصوص غير المنظمة. ولا يُعدّ التصنيف اليدوي حلاً عملياً عند التعامل مع ملايين رسائل العملاء، أو طلبات الدعم، أو الإشارات على وسائل التواصل الاجتماعي.

يُوفر تصنيف النصوص طريقة فعّالة لتنظيم هذه الفوضى تلقائيًا. فهو يمكّن المؤسسات من استخلاص رؤى قابلة للتنفيذ من مجموعات بيانات نصية ضخمة، والاستجابة بشكل أسرع لاحتياجات العملاء، وأتمتة مهام اتخاذ القرارات المتكررة.

بصراحة: بدون التصنيف الآلي للنصوص، لن تتمكن منصات خدمة العملاء الحديثة ومقدمو خدمات البريد الإلكتروني وأنظمة مراقبة المحتوى من العمل ببساطة.

التحول نحو التعلم العميق

هيمنت أساليب التعلم الآلي التقليدية - باستخدام خوارزميات مثل بايز الساذج، وآلات المتجهات الداعمة، أو الانحدار اللوجستي - على تصنيف النصوص لسنوات. تطلبت هذه الأساليب هندسة يدوية للميزات، حيث قام الخبراء بإنشاء تمثيلات يدوية للنصوص (مثل متجهات TF-IDF أو n-grams).

غيّر التعلّم العميق كل شيء. فالشبكات العصبية، وخاصة النماذج القائمة على المحوّلات، تتعلم تمثيلات النصوص الغنية تلقائيًا أثناء التدريب. وهي تستوعب السياق والمعنى الدلالي والأنماط اللغوية الدقيقة التي أغفلتها الطرق السابقة تمامًا.

أحدث نموذج BERT ثورة في تصنيف بنية النصوص باستخدام التنبؤ ثنائي الاتجاه، حيث يحلل الرموز السابقة واللاحقة لفهم الرمز الحالي. كما يستخدم النموذج نمذجة اللغة المقنعة، إذ يخفي 15% من الرموز المدخلة أثناء التدريب لتحسين الفهم السياقي.

الأساليب الأساسية لتصنيف النصوص

تنقسم خوارزميات تصنيف النصوص إلى ثلاث فئات رئيسية: الأنظمة القائمة على القواعد، والتعلم الآلي التقليدي، وأساليب التعلم العميق. ولكل منها نقاط قوة مميزة وحالات استخدام مناسبة.

التصنيف القائم على القواعد

تعتمد أبسط الطرق على قواعد مصممة يدويًا ومطابقة الكلمات المفتاحية. إذا احتوى المستند على كلمات أو عبارات محددة، يتم تعيين تصنيف معين له.

تُعدّ الأنظمة القائمة على القواعد فعّالة في الفئات الضيقة والمحددة جيداً، حيث يستطيع خبراء المجال تحديد معايير قرار واضحة. فهي تتسم بالشفافية والسرعة، ولا تتطلب بيانات تدريب.

لكنها لا تتوسع. يصبح الحفاظ على مجموعات القواعد أمراً صعباً مع تزايد الفئات، كما أنها تفشل في التعامل مع التباين اللغوي أو المرادفات أو المعنى المعتمد على السياق.

التعلم الآلي التقليدي

تتعامل الخوارزميات الكلاسيكية مع تصنيف النصوص كمشكلة تعلم خاضعة للإشراف. فبعد تحويل النص إلى خصائص رقمية (عادةً ترددات الكلمات أو متجهات TF-IDF)، تتعلم النماذج أنماطًا إحصائية تفصل بين الفئات.

تشمل الخوارزميات الشائعة Naive Bayes (سريعة وفعالة للعديد من المهام)، و Support Vector Machines (قوية لبيانات النصوص عالية الأبعاد)، والانحدار اللوجستي (قابل للتفسير وموثوق).

تتطلب هذه الأساليب بيانات تدريب مصنفة - أي أمثلة لنصوص مصنفة مسبقًا في فئات صحيحة. يتعلم النموذج من هذه الأمثلة، ثم يتنبأ بتصنيفات النصوص الجديدة غير المرئية.

الخوارزمية	نقاط القوة	نقاط الضعف
بايز الساذج	تدريب سريع، يعمل مع مجموعات بيانات صغيرة، مخرجات احتمالية	يفترض استقلالية الميزات، وفهمًا محدودًا للسياق
آلات المتجهات الداعمة	فعال في الأبعاد العالية، وأساس نظري قوي	بطيء في التعامل مع مجموعات البيانات الكبيرة، وحساس لضبط المعلمات.
الانحدار اللوجستي	خط أساس قابل للتفسير وفعال وموثوق	حدود قرار خطية، وتفاعلات محدودة بين الميزات
الغابات العشوائية	يتعامل مع اللاخطية، وهو قوي في مواجهة التجاوز.	مكلفة حسابيًا، ويصعب تفسيرها

التعلم العميق لتصنيف النصوص

تتعلم بنى الشبكات العصبية تمثيلات النصوص الهرمية، وتلتقط كل شيء بدءًا من معاني الكلمات الفردية وحتى دلالات مستوى المستند.

تُطبّق الشبكات العصبية الالتفافية (CNNs) مرشحات على تسلسلات النصوص، وتكتشف أنماطًا محلية مثل العبارات الرئيسية. أما الشبكات العصبية المتكررة (RNNs) وشبكات الذاكرة طويلة المدى (LSTM) فتُعالج النصوص بشكل تسلسلي، مع الاحتفاظ بذاكرة الكلمات السابقة.

تُهيمن نماذج المحولات - وهي البنية الأساسية لنماذج BERT وGPT وما شابهها - حاليًا. فهي تستخدم آليات الانتباه لتقييم أهمية كل كلمة بالنسبة إلى الكلمات الأخرى، مما يُنشئ تضمينات سياقية غنية.

لكن الأمر المهم هو أن المحولات عبارة عن مصنفات نصوص قصيرة تحقق دقة فائقة في جميع المعايير. وتؤكد الأبحاث أنها غالبًا ما تتفوق على التقنيات المتخصصة، مما يثير التساؤل حول ما إذا كانت البنى الخاصة بكل مهمة لا تزال ضرورية.

التطبيقات الرئيسية وحالات الاستخدام

تُساهم تقنيات تصنيف النصوص في دعم عشرات التطبيقات العملية في مختلف القطاعات. ومن الأمثلة الشائعة على ذلك: كشف الرسائل المزعجة، وتحليل المشاعر، وتصنيف المواضيع، وكشف النوايا، ومراقبة المحتوى.

تصفية البريد العشوائي والبريد الإلكتروني

يقوم مزودو خدمة البريد الإلكتروني بتصنيف الرسائل الواردة إلى رسائل غير مرغوب فيها أو رسائل مشروعة. وتقوم خوارزميات التصنيف بتحليل أنماط المرسل، وعناوين الرسائل، ومحتوى الرسائل، والروابط المضمنة لاتخاذ هذا القرار تلقائيًا.

تستخدم مرشحات البريد العشوائي الحديثة أساليب التجميع التي تجمع بين إشارات متعددة، مما يحقق معدلات دقة أعلى من 99% مع تقليل النتائج الإيجابية الخاطئة (البريد الإلكتروني المشروع الذي تم تصنيفه بشكل خاطئ على أنه بريد عشوائي).

تحليل المشاعر

تراقب الشركات آراء العملاء من خلال تصنيف التقييمات ومنشورات وسائل التواصل الاجتماعي وردود الاستبيانات إلى إيجابية أو سلبية أو محايدة. يوفر هذا نظرة سريعة على تصور العلامة التجارية واستقبال المنتج واتجاهات رضا العملاء.

يتراوح تصنيف المشاعر من القرارات الثنائية البسيطة (الإبهام لأعلى أو لأسفل) إلى التصنيف العاطفي الدقيق (الفرح، الغضب، الحزن، المفاجأة).

تصنيف المواضيع وتصنيف المحتوى

تقوم مواقع تجميع الأخبار وأنظمة إدارة المحتوى والمكتبات الرقمية بتصنيف المقالات والوثائق تلقائياً باستخدام عناوين المواضيع. وهذا يتيح تحسين البحث وأنظمة التوصية وتنظيم المحتوى.

تم جمع مجموعة بيانات Reuters-21578، وهي واحدة من أكثر المجموعات استخدامًا على نطاق واسع لأبحاث تصنيف النصوص، من وكالة أنباء رويترز وتحتوي على فئات مواضيع متنوعة.

أتمتة دعم العملاء

يُحدد تصنيف الغرض ما يريده العملاء من رسائلهم - سواءً كان ذلك الدعم الفني، أو الاستفسارات المتعلقة بالفواتير، أو معلومات المنتج، أو تغييرات الحساب. ويعتمد توجيه التذاكر إلى الفرق المختصة أو تفعيل الردود الآلية على دقة هذا التصنيف.

تستخدم برامج الدردشة الآلية تصنيف النوايا بشكل مستمر، حيث تفسر رسائل المستخدمين لاختيار الاستجابات أو الإجراءات ذات الصلة.

الإشراف على المحتوى

تستخدم المنصات نماذج تصنيف لتحديد المحتوى غير اللائق، مثل خطاب الكراهية، والتحرش، والمعلومات المضللة، والمحتوى المخصص للبالغين، أو وصف الصور العنيفة. ويراجع المشرفون البشريون المحتوى المُبلغ عنه، لكن تصنيف الذكاء الاصطناعي يوفر طبقة الفرز الأولى على نطاق واسع.

طلب	نوع التصنيف	الفئات النموذجية
تصفية البريد الإلكتروني	ثنائي	بريد مزعج / ليس بريدًا مزعجًا
تحليل المشاعر	فئات متعددة	إيجابي / محايد / سلبي
تصنيف الأخبار	فئات متعددة	السياسة / الرياضة / الأعمال / التكنولوجيا / إلخ.
كشف النوايا	فئات متعددة	سؤال / أمر / شكوى / تحية
الإشراف على المحتوى	متعدد التصنيفات	خطاب كراهية / عنف / محتوى للبالغين / معلومات مضللة

قم ببناء أنظمة تصنيف النصوص باستخدام الذكاء الاصطناعي المتفوق

يساعد تصنيف النصوص الشركات على فرز وفهم كميات كبيرة من البيانات المكتوبة دون الحاجة إلى مراجعة كل شيء يدويًا. متفوقة الذكاء الاصطناعي تتخصص الشركة في معالجة اللغات الطبيعية، والتعلم الآلي، والاستشارات القانونية، والذكاء الاصطناعي التوليدي، وتطوير روبوتات الدردشة المدعومة بالذكاء الاصطناعي، وتحليلات البيانات، وتطوير برامج الذكاء الاصطناعي المخصصة. ويعتبر فريقها تصنيف النصوص حلاً لمعالجة اللغات الطبيعية لأتمتة الأعمال ومعالجة كميات كبيرة من النصوص غير المنظمة.

بإمكان شركة AI Superior تطوير أدوات تصنيف النصوص لـ:

الوثائق التجارية والتقارير الداخلية
رسائل البريد الإلكتروني، والتذاكر، والتقييمات، ورسائل العملاء
سير عمل التوجيه أو التصنيف القائم على معالجة اللغة الطبيعية
ميزات البحث أو المساعد المدعومة من LLM
التكامل مع المنصات وأنظمة البيانات الحالية

👉تواصل مع شركة AI Superior لمناقشة أدوات تصنيف النصوص لمستندات عملك، أو اتصالات العملاء، أو سير العمل الداخلي.

تدريب نماذج تصنيف النصوص

يتطلب بناء مصنفات فعالة بيانات تدريب عالية الجودة، ومعالجة مسبقة مناسبة، واختيار نموذج دقيق. وتتبع هذه العملية عدة خطوات قياسية.

إعداد مجموعة البيانات

يبدأ التدريب بأمثلة مصنفة - عينات نصية مصنفة مسبقًا في فئات صحيحة. حجم مجموعة البيانات مهم: غالبًا ما تعمل تقنيات التعلم الآلي التقليدية مع آلاف الأمثلة، بينما يحتاج التعلم العميق عادةً إلى عشرات الآلاف أو أكثر.

تدعم العديد من مجموعات البيانات المعيارية أبحاث تصنيف النصوص. تحتوي مجموعة بيانات ستانفورد لتصنيف المشاعر (SST-2)، المتوفرة على موقع Hugging Face، على ما يقرب من 70,000 صف مقسمة إلى مجموعات تدريب (67.3 ألف صف)، وتحقق (872 صف)، واختبار (1.82 ألف صف) لتصنيف المشاعر الثنائي.

يجب أن تكون التصنيفات متوازنة (أي أن يكون عدد الأمثلة في كل فئة متساوياً تقريباً) وإلا ستميل النماذج نحو الفئات الأكثر شيوعاً. ويتطلب عدم توازن الفئات استخدام تقنيات مثل زيادة عدد العينات، أو تقليل عددها، أو دوال الخسارة المرجحة.

معالجة النصوص المسبقة وهندسة الميزات

نادراً ما يتم إدخال النص الخام مباشرة إلى النماذج. تعمل المعالجة المسبقة على تنظيف وتوحيد المدخلات من خلال خطوات مثل تحويل الأحرف إلى صغيرة، وإزالة علامات الترقيم، وحذف الكلمات الشائعة، والتجذير أو التجريد.

يتطلب التعلم الآلي التقليدي استخراج الميزات بشكل صريح - تحويل النص إلى متجهات رقمية. تشمل الأساليب الشائعة حقيبة الكلمات (عدد مرات تكرار الكلمات)، وTF-IDF (ترجيح تردد المصطلح - تردد المستند العكسي)، و n-grams (تسلسلات الكلمات المتجاورة).

تتعامل نماذج التعلم العميق مع الكثير من هذا تلقائيًا، باستخدام تضمينات متعلمة تربط الكلمات بتمثيلات متجهة كثيفة تلتقط العلاقات الدلالية.

نموذج التدريب والتقييم

قسّم مجموعات البيانات إلى مجموعات تدريب وتحقق واختبار. يتعلم النموذج الأنماط من بيانات التدريب، ويضبط المعلمات الفائقة باستخدام أداء التحقق، ويقدم تقارير عن المقاييس النهائية على مجموعة الاختبار المحجوزة.

تشمل مقاييس التقييم القياسية الدقة (نسبة التنبؤات الصحيحة)، والدقة (من الإيجابيات المتوقعة، كم كان عددها صحيحًا)، والاستدعاء (من الإيجابيات الفعلية، كم كان عددها)، ودرجة F1 (المتوسط التوافقي للدقة والاستدعاء).

يوفر التحقق المتبادل - تقسيم البيانات بشكل متكرر إلى مجموعات تدريب/اختبار مختلفة - تقديرات أداء أكثر قوة، خاصة مع البيانات المحدودة.

تحديات تصنيف النصوص

على الرغم من التقدم الملحوظ، لا تزال هناك العديد من التحديات التي تعترض بناء أنظمة تصنيف قوية.

الغموض والاعتماد على السياق

اللغة بطبيعتها غامضة. فالكلمة نفسها تحمل معاني مختلفة في سياقات مختلفة ("بنك" بمعنى مؤسسة مالية مقابل ضفة نهر). كما أن السخرية والتهكم واللغة المجازية تزيد من تعقيد تصنيف المشاعر.

تُوفّر النصوص القصيرة، الشائعة في وسائل التواصل الاجتماعي ورسائل العملاء، سياقاً محدوداً للنماذج التي يمكنها العمل معها. قد يعتمد معنى التغريدة على الأحداث الجارية، أو المراجع الثقافية، أو تاريخ المحادثات غير الموجود في النص نفسه.

تكييف المجال

غالباً ما يكون أداء النماذج المدربة على مجال واحد (مثل تقييمات المنتجات) ضعيفاً عند تطبيقها على مجالات مختلفة (مثل السجلات الطبية أو المستندات القانونية). وتختلف المفردات وأسلوب الكتابة وتعريفات الفئات باختلاف المجالات.

التعلم بالنقل - التدريب المسبق على مجموعات بيانات عامة كبيرة، ثم الضبط الدقيق على بيانات خاصة بالمجال - يساعد ولكنه لا يقضي على الفجوة تمامًا.

اللغات المتعددة واللغات ذات الموارد المحدودة

تركز معظم الأبحاث على اللغة الإنجليزية، مما يترك اللغات الأخرى دون اهتمام كافٍ. وتفتقر اللغات ذات الموارد المحدودة إلى مجموعات بيانات كبيرة مصنفة، مما يجعل التدريب صعباً.

تحاول النماذج متعددة اللغات، مثل mBERT، التعامل مع لغات متعددة في آنٍ واحد، لكن أداءها لا يزال أقل من النماذج الخاصة بكل لغة والتي تُدرَّب على بيانات وفيرة. توجد مجموعات بيانات مرجعية لبعض اللغات غير الإنجليزية، مثل مجموعة بيانات حمى الضنك باللغة الفلبينية التي تضم 4015 مثالًا للتدريب، و500 مثالًا للاختبار، و500 مثالًا للتحقق من صحة التصنيف متعدد الفئات في ظل موارد محدودة.

تطور اللغة وانحراف المفاهيم

تتغير اللغة باستمرار. تظهر مصطلحات عامية واختصارات جديدة. وتخلق الأحداث كيانات ومواضيع جديدة. وتصبح النماذج المدربة على البيانات التاريخية قديمة تدريجياً مع تغير توزيع النصوص.

يُعد التدريب المستمر وتحديثات النموذج أمراً ضرورياً للحفاظ على الأداء بمرور الوقت.

تقييم تصنيف النصوص باستخدام الذكاء الاصطناعي من قبل المعهد الوطني للمعايير والتكنولوجيا

تقيّم المبادرات الحكومية قدرات الذكاء الاصطناعي في تصنيف النصوص، لا سيما التمييز بين المحتوى المُولّد بواسطة الذكاء الاصطناعي والنصوص المكتوبة يدويًا. وتدعم سلسلة تقييم NIST GenAI Text-to-Text الأبحاث في مجال الكشف التوليدي باستخدام الذكاء الاصطناعي.

قامت سلسلة التقييم هذه بقياس نماذج الذكاء الاصطناعي التوليدية التي تنتج محتوى اصطناعياً قادراً على خداع المصنفين والبشر، مع اختبار قدرة النماذج التمييزية على اكتشاف النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

تتضمن سلسلة تقييم الذكاء الاصطناعي العام التابعة للمعهد الوطني للمعايير والتكنولوجيا جولات متعددة من عمليات التقديم والتقييم.

تساعد هذه التقييمات المعيارية في تطوير الذكاء الاصطناعي الآمن والموثوق من خلال وضع معايير لتصنيف النصوص وقدرات توليدها.

تطبيق تصنيف النصوص: اعتبارات عملية

تحتاج المنظمات التي تفكر في تصنيف النصوص إلى تقييم عدة عوامل قبل تطبيق هذه العملية.

بناء النماذج مقابل استخدام النماذج المدربة مسبقًا

يتطلب بناء نماذج مخصصة من الصفر خبرة كبيرة في علم البيانات، وموارد حاسوبية هائلة، وبيانات تدريب ضخمة. وفي العديد من التطبيقات، يوفر ضبط النماذج المدربة مسبقًا مسارًا أسرع نحو الإنتاج.

تأتي نماذج التحويل المدربة مسبقًا، والمتوفرة عبر منصات مثل Hugging Face، مدربة بالفعل على مجموعات ضخمة من النصوص. ويتيح ضبطها بدقة تكييفها مع مهام محددة باستخدام بيانات مصنفة أقل بكثير من التدريب من الصفر.

متطلبات الحوسبة والبنية التحتية

يتطلب تدريب نماذج التعلم العميق الكبيرة قدرة حاسوبية هائلة، عادةً ما تكون وحدات معالجة رسومية (GPUs) أو وحدات معالجة تناظرية (TPUs) تعمل لساعات أو أيام. أما الاستدلال (إجراء التنبؤات على نص جديد) فهو أخف وزنًا ولكنه لا يزال يستهلك موارد كثيرة عند التعامل مع كميات كبيرة من البيانات.

توفر منصات الحوسبة السحابية خدمات تعلم آلي مُدارة تتولى معالجة تعقيدات البنية التحتية. أما بالنسبة للتطبيقات ذات الأحجام المنخفضة، فإن خدمات واجهة برمجة التطبيقات المدربة مسبقًا (من مزودين مثل Google Cloud أو AWS أو Azure) تُغني تمامًا عن إدارة النماذج.

المراقبة والصيانة

تتطلب النماذج المنشورة مراقبة مستمرة. تتبع درجات ثقة التنبؤ، وراقب انخفاض الدقة، واجمع ملاحظات المستخدمين حول حالات التصنيف الخاطئ.

تحدد استراتيجيات التعلم النشط التنبؤات غير المؤكدة للمراجعة البشرية، مما يؤدي إلى إنشاء بيانات مصنفة جديدة تعمل على تحسين النموذج من خلال دورات إعادة التدريب.

التعليمات

ما الفرق بين تصنيف النصوص وتجميع النصوص؟

يُصنّف النص النصوصَ باستخدام تصنيفات مُحددة مسبقًا من مجموعة ثابتة من الفئات، وهذه الفئات موجودة قبل تحليل النص. أما تجميع النصوص فيجمع المستندات المتشابهة معًا دون فئات مُحددة مسبقًا، مكتشفًا التجمعات الطبيعية في البيانات. يُعدّ التصنيف تعلّمًا مُوجّهًا (يتطلب بيانات تدريب مُصنّفة)، بينما التجميع تعلّم غير مُوجّه (يعمل على بيانات غير مُصنّفة).

ما مقدار بيانات التدريب التي أحتاجها لتصنيف النصوص؟

تستطيع خوارزميات التعلم الآلي التقليدية العمل مع مئات إلى آلاف الأمثلة المصنفة لكل فئة. بينما تحتاج نماذج التعلم العميق عادةً إلى عشرات الآلاف من الأمثلة للتدريب من الصفر. مع ذلك، غالبًا ما يحقق ضبط نماذج المحولات المدربة مسبقًا أداءً قويًا باستخدام مئات الأمثلة فقط لكل فئة، نظرًا لأن النموذج يفهم بالفعل أنماط اللغة العامة.

هل يمكن لتصنيف النصوص التعامل مع لغات متعددة؟

نعم، ولكن بفعالية متفاوتة. تدعم النماذج متعددة اللغات مثل mBERT وXLM-RoBERTa، وغيرها من البنى المشابهة، عشرات اللغات في نموذج واحد. يكون الأداء في أفضل حالاته مع اللغات الغنية بالموارد التي تتوفر لها بيانات تدريب وفيرة (الإنجليزية، الإسبانية، الفرنسية، الصينية)، بينما يكون أضعف مع اللغات ذات الموارد المحدودة. عادةً ما تتفوق النماذج الخاصة بكل لغة على النماذج متعددة اللغات عند توفر بيانات تدريب كافية.

ما الفرق بين التصنيف متعدد الفئات والتصنيف متعدد التصنيفات؟

يُخصص التصنيف متعدد الفئات تصنيفًا واحدًا فقط من بين عدة فئات محتملة (فالمقال الإخباري إما أن يكون "رياضيًا" أو "سياسيًا" أو "تجاريًا"، وليس أكثر من تصنيف واحد في الوقت نفسه). أما التصنيف متعدد التصنيفات فيتيح تخصيص تصنيفات متعددة للنص نفسه (فقد يُصنف تقييم فيلم على أنه "رومانسي" و"كوميدي"). ويتطلب التصنيف متعدد التصنيفات بنى نماذج أو طبقات إخراج مختلفة، حيث تُعامل كل تصنيف على أنه قرار ثنائي مستقل.

كيف أتعامل مع مجموعات البيانات غير المتوازنة حيث تحتوي بعض الفئات على أمثلة أكثر بكثير؟

تعالج عدة تقنيات عدم توازن الفئات. منها زيادة تمثيل الفئات الأقل تمثيلاً بتكرار الأمثلة أو توليد عينات اصطناعية، وتقليل تمثيل الفئات الأكثر تمثيلاً بإزالة الأمثلة عشوائياً، وتطبيق أوزان للفئات تُعاقب تصنيف الفئات الأقل تمثيلاً بشكل خاطئ بشكل أكبر أثناء التدريب، واستخدام مقاييس تقييم مثل مقياس F1 أو المساحة تحت منحنى ROC التي تأخذ عدم التوازن في الحسبان، بدلاً من دقة التصنيف الخام التي قد تكون مضللة.

ما هي الدقة التي يجب أن أتوقعها من مصنف النصوص؟

يعتمد ذلك بشكل كبير على مدى تعقيد المهمة، وجودة البيانات، والنهج المُختار. غالبًا ما يحقق التصنيف الثنائي البسيط (مثل كشف البريد العشوائي) دقة تتراوح بين 95 و99% باستخدام الأساليب الحديثة. أما مشاكل التصنيف المتعدد التي تتضمن العديد من الفئات المتشابهة أو بيانات تدريب محدودة، فقد تصل دقتها إلى ما بين 70 و85%. تصل نماذج المحولات المتطورة إلى دقة تتراوح بين 90 و96% وفقًا للمعايير القياسية، ولكن يختلف الأداء في الواقع العملي بناءً على التحديات الخاصة بكل مجال.

كيف يمكنني أن أشرح لماذا اتخذ نموذجي قرار تصنيف محدد؟

لا تزال قابلية تفسير النماذج تمثل تحديًا، لا سيما في مجال التعلم العميق. تشمل التقنيات المستخدمة تصوير الانتباه (توضيح الكلمات التي ركز عليها النموذج)، وLIME أو SHAP (شرح التنبؤات الفردية من خلال اختبار الاضطرابات)، ودرجات أهمية الميزات. توفر النماذج الأبسط، مثل الانحدار اللوجستي، عملية اتخاذ قرارات أكثر شفافية من خلال معاملات قابلة للتفسير. غالبًا ما يكون التوازن بين الدقة وقابلية التفسير هو العامل الحاسم في اختيار النموذج؛ حيث تُستخدم النماذج الشفافة في الصناعات الخاضعة للتنظيم، بينما تُستخدم النماذج المغلقة لتحقيق أقصى أداء.

خاتمة

تطور تصنيف النصوص في مجال الذكاء الاصطناعي من أنظمة بسيطة تعتمد على القواعد إلى نماذج متطورة للتعلم العميق تضاهي الأداء البشري في العديد من المهام. فهو يمكّن المؤسسات من معالجة كميات هائلة من النصوص تلقائيًا، واستخلاص البنية والرؤى من البيانات غير المهيكلة.

يُسهم التحول نحو البنى القائمة على المحولات في رفع مستوى الدقة مع تقليل الحاجة إلى هندسة خاصة بكل مهمة. وتُتيح النماذج المدربة مسبقًا إمكانية الوصول للجميع، مما يسمح للفرق ذات الخبرة المحدودة في مجال التعلم الآلي بنشر مصنفات فعالة من خلال الضبط الدقيق.

لا تزال هناك تحديات قائمة، منها التعامل مع تحولات المجال، ودعم اللغات ذات الموارد المحدودة، وإدارة الغموض، والحفاظ على الأداء مع تطور اللغة. لكن التقنية الأساسية ناضجة، ومُجرَّبة ميدانيًا، وجاهزة للنشر في بيئات الإنتاج عبر تطبيقات لا حصر لها.

سواءً أكان الأمر يتعلق بتصفية الرسائل المزعجة، أو تحليل آراء العملاء، أو توجيه طلبات الدعم، أو مراقبة المحتوى، فإن تصنيف النصوص يُشكّل الأساس لفهم الكم الهائل من البيانات النصية التي تواجهها المؤسسات الحديثة. ويُعدّ فهم كيفية عمل هذه الأنظمة، وقدراتها، وحدودها، أمرًا بالغ الأهمية لأي شخص يُطوّر تطبيقات مدعومة بالذكاء الاصطناعي لمعالجة اللغة.

دعونا نعمل معا!