الطريق إلى تحليل بيانات أبسط لعلماء ومحللي البيانات، بدعم من OpenAI.
Python Pandas عبارة عن مجموعة أدوات مفتوحة المصدر توفر لعلماء ومحللي البيانات إمكانيات معالجة البيانات وتحليلها باستخدام لغة برمجة Python. تحظى مكتبة Pandas بشعبية كبيرة في مرحلة المعالجة المسبقة للتعلم الآلي والتعلم العميق. ولكن الآن يمكنك فعل المزيد معها.
مكتبة جديدة لعلوم البيانات اسمها Pandas AI وهي مكتبة Python تدمج إمكانات الذكاء الاصطناعي التوليدي generative artificial intelligence في Pandas، مما يجعل إطارات البيانات data frames حوارية conversational.
ما هو Pandas AI؟
ماذا يعني جعل إطارات البيانات حوارية؟
هذا يعني بالضبط ما تقوله – يمكنك التحدث مع مجموعة البيانات الخاصة بك. نعم، سمعته، يمكنك التحدث إلى بياناتك والحصول على ردود سريعة. كعالم بيانات أو محلل، لن تحتاج إلى التحديق في مجموعة البيانات الخاصة بك، وتصفح الصفوف والأعمدة لساعات لا نهاية لها بعد الآن. Pandas AI لا يحل محل Pandas ، إنه يمنحها دفعة كبيرة فقط!
يقضي علماء ومحللو البيانات الكثير من الوقت في تنظيف البيانات لمرحلة التحليل. سيكون بإمكانهم الآن نقل تحليل بياناتهم إلى المستوى التالي. يبحث متخصصو البيانات في الأساليب والعمليات المختلفة التي يمكنهم استخدامها لتقليل الوقت الذي يقضيه في إعداد البيانات، ويمكنهم الآن استخدام Pandas AI.
سيتم استخدام PandasAI جنبًا إلى جنب مع Pandas، فهي ليست بديلاً عن Pandas. بدلاً من الاضطرار إلى البحث والإجابة على الأسئلة المتعلقة بمجموعة البيانات بنفسك، يمكنك طرح هذه الأسئلة على PandasAI وستظهر إجابات في شكل Pandas DataFrames.
مع ما يقال، هل هذا يعني أن الناس لم يعودوا بحاجة إلى إتقان لغة بايثون لتحقيق تحليل البيانات باستخدام أدوات مثل مكتبة Pandas؟
بمساعدة OpenAI API، تهدف Pandas AI إلى تحقيق هدف التحدث الافتراضي مع آلة لإخراج النتائج التي تريدها بدلاً من الاضطرار إلى برمجة المهمة بنفسك. ستخرج الآلة النتيجة بلغتها – الكود القابل للتفسير الآلي (DataFrame).
كيف يمكنني استخدام Pandas AI؟
تثبيت Pandas AI باستخدام Pip
pip install pandasai
استيراد PandasAI مع OpenAI
من أجل الاستفادة من مكتبة Pandas AI الجديدة، ستحتاج إلى مفتاح OpenAI. بمجرد بدء تشغيل النوتبوك الخاص بك ، ستحتاج إلى استيراد ما يلي:
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token=your_API_key)
إذا لم يكن لديك مفتاح OpenAI API فريد، يمكنك إنشاء حساب على منصة OpenAI وإنشاء مفتاح API هنا. ستتلقى رصيدًا قدره 5 دولارات أمريكية يمكن استخدامه لاستكشاف واجهة برمجة التطبيقات وتجربتها.
بمجرد الانتهاء من الإعداد، ستكون جاهزًا لبدء استخدام Pandas AI.
تشغيل النموذج على Dataframe الخاص بك
أولاً، ستحتاج إلى تشغيل نموذج OpenAI الخاص بك على Pandas AI:
pandas_ai = PandasAI(openAImodel)
ستحتاج بعد ذلك إلى تشغيل النموذج في إطار البيانات، والذي يتكون من “معلمتين” إطار البيانات الذي تعمل به والسؤال الذي تريد طرحه:
pandas_ai.run(df, prompt='the question you would like to ask?')
على سبيل المثال، قد تبحث في مجموعة البيانات الخاصة بك وتهتم بالصفوف حيث تكون قيمة العمود أكبر من 5. يمكنك القيام بذلك باستخدام Pandas AI:
import pandas as pd
from pandasai import PandasAI
# Sample DataFrame
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})
# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI()
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which are the 5 happiest countries?')
سيعيد إخراج DataFrame:
6 Canada
7 Australia
1 United Kingdom
3 Germany
0 United States
Name: country, dtype: object
كما أن لديها القدرة على إجراء استعلامات أكثر تعقيدًا، مثل الحسابات الرياضية mathematical calculations وتصورات البيانات data visualizations.
مثال على تصور البيانات:
pandas_ai.run(
df,
"Plot the histogram of countries showing for each the gpd, using different colors for each bar",
)
إخراج تصور البيانات:
يعد Pandas AI جديدًا جدًا، ولا يزال الفريق يبحث عن طرق لتحسين المكتبة. اعتبارًا من العاشر من مايو، لا يزال لديهم ما يلي في قائمة المهام الخاصة بهم:
- أضافة دعمًا لمزيد من LLMs.
- جعل PandasAI متاحًا من CLI.
- إنشاء واجهة ويب لـ PandasAI.
- إضافة اختبارات الوحدة unit tests.
هم مدعوون للاقتراحات والمساهمات. إذا كنت مهتمًا بالمساهمة في نمو Pandas AI ، فيرجى الرجوع إلى الإرشادات المساهمة.
إذا كنت ترغب في مشاهدة جولة حول استخدام Pandas AI ، فراجع هذا الفيديو:
على الرغم من أن Pandas AI لا تحل محل Pandas، إلا أنها أداة جيدة لتعزيز سير عملك. على الرغم من أنه يمكنك طرح أسئلة على Pandas AI حول مجموعة البيانات الخاصة بك، إلا أنك ستظل بحاجة إلى أن تكون بارعًا في البرمجة لتصحيح المكتبة وتوجيهها عندما ترتكب أخطاء.