Javascript Disabled!

Please Enable Javascript if you disabled it, or use another browser we preferred Google Chrome.
Please Refresh Page After Enable

Powered By UnCopy Plugin.

واریانس پانداها


“Pandas” کتابخانه ای از نرم افزار است که به زبان پایتون برای انجام تجزیه و تحلیل و دستکاری داده ها نوشته شده است. اگر بخواهیم میزان گسترش در دیتافریم شما را بدانیم چه؟ برای انجام این کار از واریانس استفاده می شود. برای نشان دادن اندازه گیری بین اعداد در داده های اسپرد استفاده می شود. پانداها تابع واریانس را ارائه کرده اند که درجه مجموعه داده ها را نشان می دهد. تابع واریانس پاندا “var()” است. هر چه داده ها بیشتر باشد، واریانس در رابطه با میانگین بیشتر است. بعداً، همه نحوه استفاده از واریانس پانداها را انجام خواهیم داد. برای پیاده سازی کد در مثال، از نرم افزار “spyder” استفاده خواهیم کرد که یک نرم افزار سازگار با زبان پایتون است.

نحو

# “df.var()”

دستور فوق برای محاسبه واریانس در چارچوب داده استفاده می شود. “df” در نحو نشان دهنده “dataframe” است.

ما روش زیر را برای توضیح مثال تابع واریانس پانداها اجرا خواهیم کرد:

  • محاسبه واریانس پانداها برای یک ستون واحد در چارچوب داده.
  • محاسبه واریانس پانداها از یک ستون واحد در چارچوب داده با تغییر آرگومان.
  • محاسبه واریانس پانداها برای چندین ستون در چارچوب داده.
  • واریانس پانداها برای محاسبه کل ستون های چارچوب داده.

ایجاد دیتافریم برای اجرای مثالی از واریانس پانداها

ابزار “spyder” را روی دسکتاپ/لپ تاپ خود باز کنید. اکنون، ابتدا کتابخانه pandas را به عنوان “pd” وارد کنید، زیرا ما در محیط پاندا در حال اجرا هستیم. بیایید یک دیتافریم ایجاد کنیم. «df» از نام‌های «تام»، «ادی»، «سم»، «لئو» و «نیک» با سن‌های «25»، «44»، «66»، «55» و «78» تشکیل شده است. “. ما داده‌های گمشده سنین را به‌عنوان «20»، «30»، «40»، «50» و «مقدار گمشده» داریم، همچنین درآمدهای آنها را در چارچوب داده‌ها به‌عنوان «78000»، «70000»، «66000» داریم. ، “33000” و “68000”. و سپس، شرط «df» را که برای ساخت دیتافرام استفاده می‌شود چاپ می‌کنیم.

دیتافریم همانطور که صفحه نمایش ستون ها و مقداری را که در کد اختصاص داده ایم را می بینیم ایجاد می شود. ما می‌توانیم ببینیم که یک “NaN” در ستون داده‌های از دست رفته در آخر نوشته شده است، به این معنی که “عددی نیست” و هیچ مقداری در آنجا تخصیص داده نشده است.

مثال شماره 01: محاسبه واریانس پانداها برای یک ستون واحد در Dataframe

در این مثال، واریانس یک ستون منفرد از چارچوب داده را تعیین خواهیم کرد. “df” از چهار ستون “نام”، “سن”، “داده های از دست رفته” و “درآمد” تشکیل شده است. نام‌های «اراده»، «تینا»، «نیلوفر»، «دریا» و «سوانی» و سن آنها «33»، «45»، «35»، «85» و «78» است. داده‌های از دست رفته سنی دارای مقادیر «30»، «40»، «60»، «80» و عبارت گمشده به‌عنوان «هیچ‌کدام» هستند، درآمد آنها به‌عنوان «99000»، «88000»، «77000»، «55000» است. ، و “68000”. از آنجایی که ما یک واریانس ستونی را محاسبه خواهیم کرد، باید نام ستون را با واریانس مشخص کنیم، به عنوان مثال، “income_varience”. در اینجا، ستون “درآمد” برای محاسبه واریانس انتخاب شده است. تابع var() با “df” و ستون درآمد مشخص شده است.

خروجی واریانس محاسبه شده ستون “درآمد” را با استفاده از تابع ()var pandas نشان می دهد.

مثال شماره 02: محاسبه واریانس پانداها تک ستون در Dataframe با استفاده از ddof

در اینجا ما از آرگومان ddof برای محاسبه واریانس در یک ستون استفاده خواهیم کرد. در دیتافریم، دیتافریم شامل نام‌های «شین»، «رز»، «آلن»، «ویلسون» و «دوم» است که سن‌های آن‌ها «44»، «23»، «55»، «36» و “41”. درآمد به‌عنوان «39000»، «8400»، «57000»، «54000» و «55000» و داشتن ستون داده‌های سن گمشده به‌عنوان «20»، «22»، «23»، «25» و «هیچکدام» “. سوال با استفاده از آرگومان به “0” شروع می شود. پاسخ این است که پیش‌فرض پانداها به صورت n-1 به عنوان مخرج تنظیم شده است، و اگر بخواهیم از «n» به عنوان مخرج استفاده کنیم، باید از آرگومان «ddof» استفاده کنیم و مقدار آن را به «» تغییر دهیم. 0″ به جای “1”.

“of” مخفف “درجه دلتا آزادی” است که به عنوان مقسوم‌کننده در محاسبه به عنوان “N” کار می‌کند، جایی که تعداد عناصر را نشان می‌دهد. در اینجا نیز، ستون را می توان با انتخاب شما انتخاب کرد، زیرا با کار مورد نیاز، می توانیم واریانس هر یک از ستون های متشکل از مقادیر عددی را محاسبه کنیم. ستون “درآمد” در اینجا نیز برای محاسبه واریانس انتخاب شده است.

صفحه نمایش واریانس محاسبه شده درآمد ستون را با استفاده از آرگومان ddof روی “0” به صورت “212560000” نشان می دهد:

مثال شماره 03: واریانس پانداها برای محاسبه چندین ستون در Dataframe

در مثال اول، مثال نحوه محاسبه واریانس پانداهای تک ستونی در دیتافریم را انجام دادیم. اکنون با استفاده از تابع pandas var () واریانس را در چندین ستون محاسبه می کنیم. چارچوب داده شامل نام‌هایی مانند «نینا»، «یاقوت»، «علی»، «پیتر» و «لیزا» با سن‌های «55»، «85»، «45»، «31» و «51» است. . داده‌های ارزش گمشده سنین دارای مقادیر «21»، «32»، «20»، «36» و عبارت گمشده است. درآمد این افراد به صورت «70000»، «47000»، «62000»، «45000» و «56000» است.

برای محاسبه واریانس در پانداها، ستون های “سن” و ستون “درآمد” را انتخاب کرده ایم. می‌توانیم ستون‌ها را تعیین کنیم و آنها را برای محاسبه واریانس با توجه به عملکرد تحلیل بیشتر وارد کنیم.

خروجی شامل واریانس محاسبه شده «سن» و ستون «درآمد» به ترتیب انتخاب شده است. می بینیم که واریانس ستون های مختلف به طور جداگانه با نام ستون های آنها نشان داده شده است.

مثال شماره 04: واریانس پانداها برای محاسبه کل ستون های فریم داده

در این مثال، ما تابع pandas var() را برای محاسبه واریانس در کل دیتافریم پیاده سازی خواهیم کرد. داده‌های اینجا شامل نام‌های «فیونا»، «زین»، «استیو»، «هنری» و «زیتون» است که سن آنها «18»، «25»، «35»، «36» و «56» است. ستون از دست رفته سن دارای مقادیر «14»، «12»، «30»، «16» و «none» است. درآمد آنها «80000»، «38000»، «33000»، «95000» و «78000» است.

نحو اصلی برای هر ستون از محاسبه واریانس قاب داده استفاده می شود. دیتافریم کل ستون را با تابع “var()” انتخاب کرد. عبارت print variance تمام واریانس های محاسبه شده را چاپ می کند.

خروجی محاسبات واریانس ستون های دیتافریم را که در مقادیر عددی بودند نمایش می دهد. مانند «سن»، «سن‌های گمشده» و ستون «درآمد». ستون نام دارای کاراکتر است، بنابراین واریانس آنها قابل محاسبه نیست.

نتیجه

واریانس پانداها یک عملکرد بسیار مفید و در عین حال بسیار فنی است. با استفاده از تابع var() پانداها به محاسبه واریانس بسیار آسان کمک می کند. در این مقاله تمام روش ها را با اجرای مثالی از هر یک برای درک بهتر یاد گرفته ایم. ما محاسبه تک ستونی واریانس در پانداها، محاسبات واریانس چند ستونی در پانداها، یکی با تغییر آرگومان از تنظیمات پیش‌فرض، و همچنین برنامه محاسبه واریانس روی دیتافریم کامل انجام داده‌ایم. هر کدام از آنها بسته به نوع استفاده و شرایط و نیاز به زمان به تنهایی بسیار مفید هستند.


به این مطلب امتیاز دهید

جهت ارسال نظر اینجا کلیک کنید.