كيف نحدد درجة إفادة وغنى النص

كيف نحدد درجة إفادة وغنى النص

قبل أن نبدأ بالحديث عن درجة إفادة وغنى النص دعونا نبدأ بسؤال بسيط، ما الذي يشكل مقالة مفيدة؟

صفة الافادة هي توفير معلومات مفيدة أو مثيرة للاهتمام.

ومع ذلك، هذا لا يزال المفهوم مجرداً. مسألة تحديد درجة إفادة وغنى النص الموجود بمقال إخباري ليست بسيطة.

نحن في الميتا Almeta واجهنا هذه المشكلة واختبرنا العديد من الخوارزميات الذكية لحلها. 

في هذه المقالة سوف نقدم نظرة عامة على خطتنا لتنفيذ خدمة يمكنها اكتشاف درجة إفادة وغنى أي نص في المقالات الإخبارية لنزودك بأفضل موجز أخبار ممكن. 

تمثل هذه المقالة جوهراً لكل أبحاثنا حول خدمة تحديد درجة إفادة وغنى النص، تابع معنا هذه المقالة لتعرف كيف تمكّنا في الميتا من تطويرها.

خصائص قياس المعلومات المفيدة في النصوص

تتمثل إحدى طرق التفكير في المعلومات المفيدة في رؤيتها على أنها مجموعة من الميزات التي تأتي معاً في مقال إخباري وهي التي تحدد قيمته.

تخيل مبنى جميل، هل يمكننا تحديد ما الذي يجعله جميلاً؟ من الصعب تحديد ذلك، فقد يكون الهيكل، أو توزيع الضوء، أو ربما يكون اختيار الألوان. هذه الميزات بسيطة بالنسبة للعقل البشري، ويمكنه قياس كميتها.

يمكن أخذ نفس المفهوم عند التعامل مع النص، يمكن أن تتضمن هنا الميزات قابلية القراءة، أو إمكانية القراءة السريعة للنص، أو استخدام الكليشيهات وهي أيضاً ميزات قابلة للقياس.

المنهجية المستخدمة لتحديد درجة إفادة وغنى النص

هذه الميزات منطقية في أذهاننا وقد تم تكوينها في أذهاننا عبر سنوات من الخبرة والتطور. والسؤال المهم هنا، هل من الممكن نقل هذه الخبرات والتجارب إلى أنظمة التعلم الآلي؟ 

في مصطلحات الذكاء الاصطناعي، هذا يعني أنه يجب علينا أن نتعامل مع مشكلة اكتشاف درجة إفادة وغنى النص كمشكلة تعلم آلي. 

اقرأ أيضاً: ما هو الذكاء الصنعي والتعلم الآلي وما علاقتهما ببعضهما

يقوم النموذج بشكل أساسي على التدريب بطريقة التعلم بالإشراف لأخذ جزء من النص والحصول على الرقم الذي يمثل درجة إفادة وغنى النص. هذا النظام سوف يستخدم من ميزات مثل: قابلية القراءة، إمكانية القراءة السريعة، الثراء اللغوي للنص، كمية الكلمات في النص وميزات أخرى. 

المشكلات الموجودة في مثل هذا النموذج هو القدرة على توفير كمية كبيرة من البيانات لتدريب مثل هذا النموذج، ويمكن حلها بطرق عديدة لن نخوض بها.

اكتشاف درجة إفادة وغنى النص من وجهة نظر البشر

لحل أي مشكلة من مشاكل التعلم الآلي يجب أن نحاول فهمها أولاً. لا يمكن أن نطلب من الآلة قياس درجة إفادة وغنى نص ما إذا كنا لا نعرف كيف يفعل البشر ذلك. 

تخيل أنك حصلت على 10 مقالات وطلب منك ترتيب كل منها بمقياس من 1 إلى 10 بناءً على مدى “فائدتها” كم من الوقت ستستغرق؟ ساعة؟ نصف ساعة؟ دعنا نجرب مهمة أخرى مع تقديم 5 أزواج من المقالات، ولكل زوج عليك اختيار المقالة التي تبدو أكثر إفادة لك. من الواضح أن المهمة الثانية أبسط بكثير.

نحن كبشر ملائمون للمهمة الثانية أكثر من الأولى، فمن الأسهل بكثير الاختيار بين آيس كريم الشوكولاتة والفانيليا من ترتيب الشوكولاتة على مقياس من 10.

يمكن إجراء نفس القياس على نماذج الذكاء الاصطناعى. ولأن بناء مجموعات البيانات يتم بنائها بواسطة البشر لذلك فإن مهمة التصنيف تعتبر أبسط من مهمة الترتيب.

خطواتنا القادمة

سوف نتعامل مع هذه المشكلة على أنها مشكلة تصنيف وليست مشكلة ترتيب. وهذا سوف يسهل عملية إنشاء قاعدة البيانات بشكل يدوي. بالإضافة إلى ذلك سوف نستخدم أحدث التقنيات لتصنيف وإدارة البيانات التي تم توليدها.

في نهاية هذا المقال أتمنى أن أكون قد نجحت بإعطاء ملخص عن مشكلة تحديد درجة إفادة وغنى النص في المقالات الإخبارية وكيف يتم حلها في الميتا.

هل تعلم أننا نستخدم تقنيات الذكاء الاصطناعي في تطبيقنا؟ انظر إلى أبرز تقنيات الذكاء الصنعي الآن قيد التنفيذ. جرب تطبيق الميتا للأخبار. يمكنك تنزيله من متجر Google Play أو متجر تطبيقات Apple.

فكرة واحدة على ”كيف نحدد درجة إفادة وغنى النص

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *