From Sentiment to Political Bias in the Arab World and the Arabic Content

From Sentiment to Political Bias in the Arab World and the Arabic Content

The rise of political bias problem across several news anchors presents a real threat to free and independent journalism and a major factor in shifting the populace conception of the world. Several NGO’s, research centres and private organizations are working … متابعة قراءة From Sentiment to Political Bias in the Arab World and the Arabic Content

How to Rank Articles Based on How Informative They Are

How to Rank Articles Based on How Informative They Are – Using Snorkel

Let’s start with a simple question, what constitutes an informative article? based on Oxford’s dictionary. informative/ɪnˈfɔːmətɪv/ adjective: informativeproviding useful or interesting information However, this is still an abstract concept. Yes, it is much simpler to flag an article as spammy … متابعة قراءة How to Rank Articles Based on How Informative They Are – Using Snorkel

Informativity Detection, Our Research Gist

Informativity Detection – Almeta’s Research Gist

Let’s start with a simple question, what constitutes an informative article? based on Oxford’s dictionary. informative/ɪnˈfɔːmətɪv/ adjective: informativeproviding useful or interesting information However, this is still an abstract concept. The question of measuring How informative a piece of news is … متابعة قراءة Informativity Detection – Almeta’s Research Gist

What Makes an Article Informative and How Computers Can Measure Informativeness

What Makes an Article Informative – And How Computers Can Measure Informativity of a Text Content

The Concept of an informative text is really abstract and it is hard to come up with a definitive formula to measure it, in this article we will explore some of the features that we believe can make an article … متابعة قراءة What Makes an Article Informative – And How Computers Can Measure Informativity of a Text Content

Aspect Detection and Named Entity Linking (NEL): Using SPARQL and DBpedia

In our effort to provide the best news feed out there, one of the goals we are trying to achieve here at Almeta is to capture the interaction between different news outlets and how the coverage of the same event … متابعة قراءة Aspect Detection and Named Entity Linking (NEL): Using SPARQL and DBpedia

An Overview of The Event Extraction Task in NLP

An Overview of The Event Extraction Task in NLP

Events possess a rich structure that is important for intelligent information access systems (information retrieval, question answering, summarization, etc.). Without information about what happened, where, and to whom, temporal information about an event may not be very useful. In light … متابعة قراءة An Overview of The Event Extraction Task in NLP

Comparison of Available TTS Services

Comparison of Available TTS Services

Text-to-speech (TTS) is a type of assistive technology that reads digital text aloud. It’s sometimes called “read aloud” technology. text-to-speech applications are offering an innovative solution for users to interact with content by taking it out of books and computer screens and … متابعة قراءة Comparison of Available TTS Services

Analysis of the Readability Metric Results in Almeta News Feed

In this post, we’re analyzing the results returned by the readability metric in our news feed. If you haven’t checked our post about “How to measure the readability of a text?” before, you can read about it here. How Are We Measuring the Readability? The main part of analyzing a metric is to know how does it work. In the current version, we’re depending on the AARIBase metric for measuring the readability. So, let’s have a look first on how does AARIBase work. Here’s the AARIBase formula: AARIBase = (3.28 × NOC) + (1.43 × ACW) + (1.24 × AWS) … متابعة قراءة Analysis of the Readability Metric Results in Almeta News Feed

Clickbait Detection Using Word2Vec Representation

In a previous article, How to Detect Clickbait Headlines using NLP? We introduced the task of clickbait detection and explored how it can be modeled within the domain of machine learning and NLP. If you are not familiar with the concept of clickbait detection, make sure to review it before continuing. In this post, we’re building a classifier for clickbait detection in the news headlines depending on a pre-trained Arabic Word2Vec model and we’re validating this solution. If you are not familiar with the Word2Vec concept you can refer to this Wikipedia article for more information. News Headlines Representation In … متابعة قراءة Clickbait Detection Using Word2Vec Representation

Google’s AutoML Overview

In this post, we are exploring how Google’s AutoML can help us in Almeta in developing automatic Arabic language processing tools. Before start if you are not familiar with the term AutoML you can refer to our previous post on this topic. Who is Google AutoML for? and When to Use It? The targeted audience by Google’s cloud autoML are people who have limited knowledge in machine learning. The main goal of this cloud service is to let the user build his own AI model that is tailored to his business needs, if the provided services by Google’s AI API … متابعة قراءة Google’s AutoML Overview

ماهي تقنيات معالجة اللغات الطبيعية

ما هي تقنيات معالجة اللغات الطبيعية

قد لا يكون لديك الاطلاع الكافي على معالجة اللغات الطبيعية لكنك بالطبع تعرف كل من سيري أو أليكسا! “لم أفهم ما قلته للتو.” هذا ما يمكن أن تجيبك به سيري أو أليكسا مراراً وتكراراً. متى كانت آخر مرة طلبت فيها … متابعة قراءة ما هي تقنيات معالجة اللغات الطبيعية

كيف نحدد درجة إفادة وغنى النص

كيف نحدد درجة إفادة وغنى النص

قبل أن نبدأ بالحديث عن درجة إفادة وغنى النص دعونا نبدأ بسؤال بسيط، ما الذي يشكل مقالة مفيدة؟ صفة الافادة هي توفير معلومات مفيدة أو مثيرة للاهتمام. ومع ذلك، هذا لا يزال المفهوم مجرداً. مسألة تحديد درجة إفادة وغنى النص … متابعة قراءة كيف نحدد درجة إفادة وغنى النص

ما هو الذكاء الصنعي والتعلم الآلي

ما هو الذكاء الصنعي والتعلم الآلي وما علاقتهما ببعضهما

هل شاهدت سابقاً أحد أفلام الخيال العلمي التي تعرض شيئاً عن الذكاء الصنعي والتعلم الآلي وقلت لنفسك من المستحيل أن يحدث هذا؟ لابد أنك قد شاهدت في أحد هذه الأفلام آلات تتحدث، وآلات تفكر. على مر السنوات الماضية، لابد أنك … متابعة قراءة ما هو الذكاء الصنعي والتعلم الآلي وما علاقتهما ببعضهما

النشرة الشهرية لجهود الميتا التقنية - شهر كانون الأول ٢٠١٩

النشرة الشهرية لجهود الميتا التقنية – شهر كانون الأول ٢٠١٩

١- يومياً يتم نشر آلاف المقالات الأخبارية من قبل العديد من وكالات الأنباء المختلفة. كقارئ قد تتلقى نفس الخبر من مصادر متعددة وللعديد من المرات ضمن التدفق الأخباري المستمر، لذا من المفيد أن يكون لدينا نظام ذكي لتحديد المقالات ذات … متابعة قراءة النشرة الشهرية لجهود الميتا التقنية – شهر كانون الأول ٢٠١٩

A Guideline for Writing Research/Tech Blogs

Intro In Almeta you have to write a lot for those research tickets you have in a Sprint. You’ve to read tons of research, academic, and sometimes boring paper. But, when you write your proposal, you don’t have to write like them. As a matter of fact we want to be as close to non-techies as possible when writing our tech blogs. So, you’re an engineer and you love to code. You are a machine learning engineer and you love to read. You’re both and here comes a research/investigation ticket. You read, read, and read some more and now comes … متابعة قراءة A Guideline for Writing Research/Tech Blogs

Our Agile/Scrum Setup in Almeta

Intro We’re currently trying with different style. Between Agile/Scrum and Kanban. This is the latest we’re doing. We’re going to keep this post updated. The Team in Almeta We are a remote, cross functional team. We try to have balance in skill we have. We favor T shape employees. We <3 Valve. Skin in the Game: In a startup you’ve to eat your own food. And you’ve to take extra responsibility for any code you develop. We don’t have researchers and engineers. We have research-engineers. Those who learned to do research, develop ideas, write their code and also bring them … متابعة قراءة Our Agile/Scrum Setup in Almeta

أكبر أربع مشاكل مفتوحة في معالجة اللغات الطبيعية

قبل أن نتحدث عن مشاكل معالجة اللغات الطبيعية دعونا نبدأ بمثال معروف للجميع. متى كانت آخر مرة طلبت فيها من سيري أو أليكسا أن تفعل شيئًا ولم تفهما ما تقوله؟ أو أجابتا بشيء لا علاقة له على الإطلاق بسؤالك؟ سيري … متابعة قراءة أكبر أربع مشاكل مفتوحة في معالجة اللغات الطبيعية

أكبر التحديات في معالجة اللغة العربية

قبل أن نبدأ بالحديث عن معالجة اللغة العربية ، ذكرنا في المدونات السابقة أهمية معالجة اللغات الطبيعية ومجموعة التطبيقات الواسعة التي يتم فيها استخدام معالجة اللغات الطبيعية. نظرًا لأن الهدف من معالجة اللغات الطبيعية (NLP) هو تسهيل وتبسيط التواصل بين … متابعة قراءة أكبر التحديات في معالجة اللغة العربية

الأفكار الثلاث الأكثر إثارة في معالجة اللغات الطبيعية (NLP)

“إن معالجة اللغات الطبيعية و التعلم الآلي هما الأساس لأي نظام من الذكاء الصنعي، حيث تكمن أهميتهم في القدرة على التواصل معنا بطريقة إنسانية وأتمتة عملية التعلم، بغض النظر عماتريد الوصول اليه سواءً كان تحليلات تنبؤية أو إرشادية، تنبؤ، تحسين … متابعة قراءة الأفكار الثلاث الأكثر إثارة في معالجة اللغات الطبيعية (NLP)

ماهي الميتا؟

قصتنا وفريقنا نحن ثلاث أصدقاء منذ السنة الأولى في الجامعة وتقنيين قمنا بتأسيس شركة الميتا لأننا نحب لغتنا العربية. وقد نما فريقنا ليتضمن مجموعة من مهندسين الذكاء الصنعي الذين عقدوا العزم على تطوير مجال معالجة اللغات الطبيعية للغة العربية. لماذا … متابعة قراءة ماهي الميتا؟