Javascript Disabled!

Please Enable Javascript if you disabled it, or use another browser we preferred Google Chrome.
Please Refresh Page After Enable

Powered By UnCopy Plugin.

پانداها حداکثر ردیف ها را نمایش می دهند


پانداها یکی از محبوب ترین ابزارهایی هستند که امروزه توسط دانشمندان داده برای تجزیه و تحلیل داده های جدولی استفاده می شود. برای مقابله با محتوای جدولی، API سریعتر و موثرتری ارائه می دهد. هر زمان که فریم های داده را در حین تجزیه و تحلیل مشاهده می کنیم، Pandas به طور خودکار رفتارهای مختلف نمایش را روی مقادیر پیش فرض تنظیم می کند. این رفتارهای نمایش شامل تعداد سطر و ستون برای نمایش، دقت شناورها در هر قاب داده، اندازه ستون و غیره است. بسته به نیاز، ممکن است گاهی نیاز به اصلاح این پیش فرض ها داشته باشیم. پانداها روش های مختلفی برای تغییر رفتار پیش فرض دارند. استفاده از ویژگی “گزینه ها” پانداها ما را قادر ساخت تا این رفتار را تغییر دهیم.

پانداها حداکثر ردیف را نمایش می دهند

هر زمان که بخواهید یک قاب داده بزرگ را چاپ کنید که دارای سطرها و ستون های بیشتری از آستانه از پیش تعریف شده است، خروجی بریده می شود. برای نمایش تمام ردیف‌ها در DataFrame، در این آموزش نحوه تغییر گزینه‌های نمایش پانداها را خواهید آموخت. پانداها به طور پیش‌فرض محدودیتی بر تعداد ستون‌ها و ردیف‌هایی که نمایش می‌دهند اعمال می‌کنند. اگرچه این ممکن است برای خواندن محتوا مفید باشد، اما اگر اطلاعاتی که باید مشاهده کنید نشان داده نشود، اغلب باعث ناامیدی می شود. در اینجا، ما از روش های ارائه شده در زیر با نحو آنها برای نمایش تمام ستون های دیتافریم استفاده خواهیم کرد.

to_string()

set_option()

option_context()

ما استفاده از تمام این روش ها را با اجرای عملی برای نمایش حداکثر ردیف ها در دیتافریم ارائه شده یاد خواهیم گرفت.

مثال شماره 1: استفاده از روش Pandas to_string().

این نمایش به ما می آموزد که با استفاده از روش pandas “to_string()” حداکثر ردیف ها را در یک دیتافریم در ترمینال نمایش دهیم.

برای کامپایل و اجرای برنامه های نمونه، ابزار “Spyder” را انتخاب کرده ایم. در این راهنما، ما از این ابزار برای اجرای تمام مثال های خود استفاده خواهیم کرد. ما ابزار “Spyder” را برای شروع نوشتن اسکریپت پایتون راه اندازی کرده ایم. با شروع کد، ابتدا باید کتابخانه های لازم را در فایل پایتون بارگذاری کنیم تا بتوانیم از ویژگی های آن استفاده کنیم. کتابخانه ماژول ما در اینجا “Pandas” است. بنابراین، ما آن را به فایل پایتون خود وارد کردیم و آن را با نام مستعار “pd” قرار دادیم.

از آنجایی که عملیات اصلی این مقاله نمایش حداکثر ردیف های یک دیتافریم است، ابتدا به یک دیتافریم نیاز داریم. اکنون به شما بستگی دارد که آیا ترجیح می دهید یک دیتافریم تولید کنید یا یک فایل CSV وارد کنید. ما یک نمونه فایل CSV وارد کرده ایم. برای خواندن یک فایل CSV در برنامه پایتون، از تابع “pd.read_csv()” pandas استفاده کرده ایم. بین پرانتز این تابع، فایل CSV را که می‌خواهیم نمایشگر را بخوانیم، ارائه کرده‌ایم که “industry.csv” است. ما یک متغیر “df” ساخته ایم تا خروجی تولید شده از خواندن فایل CSV ارائه شده را ذخیره کند. سپس از روش print() برای نمایش دیتافریم استفاده کردیم.

وقتی این برنامه پایتون را با زدن گزینه Run file اجرا می کنیم، یک دیتافریم روی کنسول نمایش داده می شود. می توانید مشاهده کنید که 43 ردیف در نتیجه زیر وجود دارد اما تنها ده ردیف نمایش داده می شود. این به این دلیل است که مقدار پیش فرض کتابخانه پانداها تنها 10 ردیف است.

ما از متد pandas “to_string” برای نمایش تمام سطرها در اینجا استفاده خواهیم کرد. ساده ترین راه برای نشان دادن حداکثر ردیف ها از یک قاب داده با این تکنیک است. با این حال، از آنجایی که فریم کامل داده را به یک رشته تبدیل می کند، برای مجموعه داده های بسیار بزرگ (در میلیون ها) توصیه نمی شود. با این وجود، این به طور موثر برای مجموعه داده هایی که در طول هزاران هستند کار می کند.

ما از نحو ارائه شده در بالا برای تابع “to_string()” پیروی کرده ایم. ما به سادگی متد “to_string()” را با نام dataframe خود فراخوانی کردیم. سپس این متد را در تابع print() قرار دادیم تا هنگام فراخوانی نمایش داده شود.

عکس فوری خروجی یک دیتافریم را به ما نشان می دهد که تمام ردیف ها در ترمینال نمایش داده می شوند.

مثال شماره 2: استفاده از روش تنظیم_گزینه پانداها

روش دومی که ما در این راهنما تمرین خواهیم کرد، پانداها “set_option()” برای نمایش حداکثر ردیف های دیتافریم ارائه شده است.

در فایل پایتون، کتابخانه pandas را برای دسترسی به تابع فوق وارد کرده ایم. ما از پانداهای “pd.read_csv()” برای خواندن فایل CSV ارائه شده استفاده کرده ایم. ما تابع “pd.read_CSV()” را با نام فایل CSV که می‌خواهیم بین پرانتزهای آن استفاده کنیم که “Sampledata.csv” است، فراخوانی کردیم. هنگام وارد کردن فایل CSV، دایرکتوری فعلی برنامه پایتون را در نظر داشته باشید. فایل CSV شما باید در همان دایرکتوری قرار گیرد. در غیر این صورت با پیغام خطای “فایل یافت نشد” مواجه خواهید شد. ما یک متغیر “sample” برای ذخیره دیتافریم از فایل CSV ایجاد کرده ایم. ما متد print() را برای نمایش این دیتا فریم فراخوانی کردیم.

در اینجا، ما خروجی خود را داریم که در آن تنها ده سطر نمایش داده می شود. حداکثر تعداد ردیف های نشان داده شده 99 است. تمام ردیف های دیگر بین 5 ردیف اول و پنج ردیف آخر کوتاه شده اند.

برای نمایش حداکثر ردیف هایی که 99 برای این دیتافریم هستند، از تابع “set_option()” ماژول pandas استفاده می کنیم. پانداها دارای سیستم عاملی هستند که به شما امکان می دهد رفتار و نمایشگر را تغییر دهید. این روش ما را قادر می سازد تا نمایشگر را طوری تنظیم کنیم که یک قاب داده کامل را به جای یک قاب کوتاه نشان دهد. پانداها تابع “set_ option()” را برای نمایش تمام ردیف های قاب داده ارائه می کنند.

ما “pd.set_option()” را فراخوانی کرده ایم. این تابع دارای پارامترهای “display.max_rows” است. “display.max_rows” حداکثر تعداد ردیف هایی را که هنگام نمایش یک دیتافریم نمایش داده می شود، مشخص می کند. مقدار “max_rows” به طور پیش فرض روی 10 تنظیم شده است. اگر «هیچ‌کدام» انتخاب شده باشد، نشان‌دهنده تمام ردیف‌های قاب داده است. همانطور که می خواهیم تمام ردیف ها را نمایش دهیم، بنابراین آن را روی “هیچ” تنظیم می کنیم. در نهایت، ما از تابع print() برای نمایش دیتافریم با حداکثر ردیف استفاده کردیم.

این نتیجه ارائه شده در عکس فوری زیر را به دست می دهد.

مثال شماره 3: استفاده از روش Pandas option_context().

آخرین روشی که در اینجا مورد بحث قرار می‌دهیم، “option_context()” برای نمایش تمام ردیف‌های دیتافریم است. برای این کار بسته pandas را وارد فایل پایتون کردیم و شروع به نوشتن کد کردیم. ما از تابع “pd.read_csv()” برای خواندن فایل CSV که مشخص کرده ایم استفاده کرده ایم. ما یک متغیر “dalta” برای ذخیره دیتافریم از فایل CSV مشخص شده ایجاد کردیم. سپس، ما به سادگی دیتافریم را با روش “print()” چاپ کردیم.

نتیجه ای که از اجرای کد بالا به دست آوردیم یک دیتافریم با ردیف های کوتاه شده را به ما نشان می دهد.

اکنون پانداهای “pd.option_context()” را روی این دیتا فریم اعمال می کنیم. این تابع با “set_option()” یکسان است. تنها تفاوت بین این دو رویکرد این است که “set_option()” تنظیمات را به طور دائم تغییر می دهد، در حالی که “option _context()” فقط آنها را در محدوده خود تغییر می دهد. این روش همچنین ردیف‌های display.max را به عنوان پارامتر می‌گیرد که برای نمایش تمام ردیف‌های قاب داده، آن را روی «هیچ» تنظیم می‌کنیم. پس از فراخوانی این تابع، فقط آن را از طریق متد print() نمایش می دهیم.

در اینجا می‌توانیم دیتافریم کامل را با حداکثر ردیف‌های آن که 2747 هستند، مشاهده کنیم.

نتیجه

این مقاله بر روی گزینه های نمایش پانداها تمرکز دارد. گاهی اوقات ممکن است لازم باشد که دیتافریم کامل را در ترمینال مشاهده کنیم. پانداها گزینه های مختلفی را برای این منظور به ما می دهند. در این راهنما از سه مورد از این استراتژی ها استفاده کرده ایم. اولین مثال مبتنی بر استفاده از روش “to_string()” بود. نمونه دوم ما به ما می آموزد که “set_option()” را پیاده سازی کنیم در حالی که آخرین تصویر متد “option_context()” را اجرا می کند. همه این تکنیک‌ها نشان داده شده‌اند تا شما را با روش‌های جایگزینی که پانداها برای دستیابی به نتیجه مورد نیاز در اختیار ما قرار می‌دهند آشنا کنند.


به این مطلب امتیاز دهید

جهت ارسال نظر اینجا کلیک کنید.