توضیحات تکمیلی
با در نظر گرفتن حجم روزافزون دادههایی که در محیطهای مختلف تولید میشوند و در دسترس قرار میگیرند و همین طور با توجه به اهمیت بیشتری که تحلیل و بهرهمندی از این اطلاعات دارد، ما نیازمند ابزارهای قویتر و کارآمدتری برای کار با انواع دادهها هستیم. به نحوی که هم بتوانیم حجم بالای اطلاعات را تحلیل و بررسی کنیم و هم این که ابزارهای انعطافپذیر با کاربری آسان برای انجام این موارد داشته باشیم. ابزارها و برنامههای صفحه گسترده (Spreadsheet) مانند اکسل و گوگل شیت، برای بسیاری از کاربردهای روزمره کافی هستند. اما زمانی که حجم اطلاعات بسیار زیاد باشد، منابع اطلاعاتی متعددی نیازمند بررسی و تجمیع باشند و یا نیازمند انجام یک سری امور تکراری از طریق برنامهنویسی باشیم، محدودیتهای موجود در این ابزارها، بیشتر نمایان خواهد شد.
کتابخانه پانداس (pandas)، یک کتابخانه متن-باز (اوپن-سورس) و رایگان است که برای استفاده در زبان برنامهنویسی پایتون توسعه داده شده و یکی از چندین پروژه مورد حمایت NumFOCUS است. نام پانداس (pandas) از مخففسازی عبارت Panel Data و جمع بستن آن به دست آمده است. پنل دیتا، اصطلاحی است که در رشتههایی از قبیل آمار و اقتصادسنجی، به دادههای دوبعدی دارای سطر و ستون اطلاق میشود.
کتابخانه پانداس، امروزه یک ابزار بسیار مهم برای تحلیل اطلاعات است که تقریبا در جعبه ابزار هر کسی قرار دارد که مشغول کار در حوزه یادگیری ماشین و علوم داده است. سرعت بسیار زیاد، توانایی کار با حجم داده بسیار بالا، انعطافپذیری، سادگی در استفاده و امکانات متعدد برای انجام امور رایج در حوزههای مختف دیتاساینس، از مهمترین ویژگیهای پانداس است.
در آموزش پانداس، سعی شده است تمام مفاهیم و مهارتهای مورد نیاز برای کار با کتابخانه pandas گنجانده شود و مخاطب را به سطح متوسط از کاربری این کتابخانه بسیار مهم، برساند. در این آموزش، بعد از آشنایی مقدماتی با پانداس و مرور مختصری بر امکانات آن، به بررسی عمیقتر ویژگیها و کاراییهای دو کلاس بسیار مهم از این کتابخانه پرداخته شده است: سریها (Series) و دیتافریمها (Dataframe). مهمترین مطالبی که مورد بحث و بررسی قرار میگیرند، عبارتند از:
- آشنایی با پانداس و امکانات آن
- نصب و راهاندازی کتابخانههای مورد نیاز
- خواندان اطلاعات از فایلهای CSV
- ویژگیهای سریها و دیتافریمها
- تفاوت و شباهت میان سریها و دیتافریمها
- شمارش، مرتبسازی و فیلتر کردن اطلاعات
- محاسبات آماری و ریاضی روی دادهها
- تبدیل انواع دادهها
- بهینهسازی استفاده از حافظه
- مفهوم ایندکس یا نمایه
- مصورسازی اطلاعات و ترسیم نمودارها
مطالب این فرادرس در سطحی است که برای اغلب کاربردهای عملی پانداس در پروژههای دادهکاوی و علوم داده، کافی خواهد بود و هر کسی که قصد استفاده از این ابزار را داشته باشد، میتواند به سادگی تمامی چیزهایی را که لازم دارد، از طریق این آموزش فرا بگیرد. البته، پیشنیاز استفاده از این فرادرس، آشنایی با زبان برنامهنویسی پایتون (حداقل در سطح مقدماتی) است.
فهرست سرفصلها و رئوس مطالب مطرح شده در اين مجموعه آموزشی، در ادامه آمده است:
- فصل یکم: مقدمه
- درس یکم: پانداس چیست؟
- درس دوم: پیشنیازها و ابزارها
- درس سوم: نصب پانداس (pandas)
- درس چهارم: دیتاستهای مورد استفاده
- فصل دوم: آشنایی اولیه با پانداس
- درس پنجم: خواندان اطلاعات فایل CSV
- درس ششم: عملیات پایه روی دیتافریمها
- درس هفتم: سریها و ستونهای دیتافریم
- درس هشتم: فیلتر کردن دادهها
- فصل سوم: کار با سریها
- درس نهم: آشنایی با سریها
- درس دهم: ساختن سریها از اشیاء دیگر
- درس یازدهم: مهمترین ویژگیهای سریها
- درس دوازدهم: عملیات آماری روی سریها
- درس سیزدهم: عملیات محاسباتی روی سریها
- درس چهاردهم: تبدیل سریها به اشیاء دیگر
- فصل چهارم: مباحث تکمیلی سریها
- درس پانزدهم: خواندن سریها از روی فایل
- درس شانزدهم: مرتب کردن سریها
- درس هفدهم: پارامتر inplace
- درس هجدهم: شمارش مقادیر سریها
- درس نوزدهم: اعمال توابع روی سریها
- فصل پنجم: کار با دیتافریمها
- درس بیستم: روشهای ایجاد دیتافریم
- درس بیستویکم: مقایسه سریها و دیتافریم
- درس بیستودوم: مرتبسازی دیتافریم
- درس بیستوسوم: تغییر ایندکس یا نمایه
- درس بیستوچهارم: انتخاب ستونهای دیتافریم
- درس بیستوپنجم: اتتخاب سطرهای دیتافریم
- درس بیستوششم: تغییر نام سطرها و ستونها
- درس بیستوهفتم: بهینهسازی حافظه
- فصل ششم: مباحث تکمیلی دیتافریمها
- درس بیستوهشتم: فیلتر کردن سطرها
- درس بیستونهم: ترکیب شرطهای منطقی
- درس سیام: متدهای کاربردی برای تعریف شرطها
- درس سیویکم: مقادیر ناموجود
- درس سیودوم: مقادیر تکراری
- فصل هفتم: ترسیم و مصورسازی دادهها
- درس سیوسوم: نصب و راهاندازی matplotlib
- درس سیوچهارم: ترسیم نمودار برای سریها و دیتافریم
- فصل هشتم: جمعبندی
- درس سیوپنجم: جمعبندی
مفید برای
- مهندسی کامپیوتر – نرمافزار
- آمار و دادهکاوی
- هوش مصنوعی
- علاقهمندان به برنامهنویسی پایتون
پیش نیاز
آنچه در این آموزش خواهید دید:
نرم افزارهای مرتبط با آموزش
پیش نمایشها








راهنمای سفارش آموزشها
در مورد این آموزش یا نحوه تهیه آن سوالی دارید؟
- با شماره تلفن واحد مخاطبین ۵۷۹۱۶۰۰۰ (پیش شماره ۰۲۱) تماس بگیرید. - تمام ساعات اداری
- با ما مکاتبه ایمیلی داشته باشید (این لینک). - میانگین زمان پاسخ دهی: ۳۰ دقیقه
- ۱۰۰ درصد مبلغ پرداختی در حساب کاربری شما شارژ میشود.
- و یا ۷۰ درصد مبلغ پرداختی به حساب بانکی شما بازگشت داده میشود.
نظرات