Javascript Disabled!

Please Enable Javascript if you disabled it, or use another browser we preferred Google Chrome.
Please Refresh Page After Enable

Powered By UnCopy Plugin.

پانداها به رشته


“فریم داده و رویکردهای سری که پانداها به ما ارائه می دهند را می توان برای هر ستون در قاب داده شما استفاده کرد و برای کار با رشته ها طراحی شده است. با استفاده از روش “applymap(str)” می‌توانیم دیتافریم را به رشته‌هایی تبدیل کنیم، همانطور که در نمونه زیر مشاهده می‌کنید. این روش به راحتی یک نوع داده را به یک نوع رشته ای تبدیل می کند. در پانداها، ما در درجه اول از “object” به عنوان نوع داده برای رشته استفاده می کنیم. ما ممکن است تعداد کل کاراکترهای موجود در مقادیر ستون را با استفاده از تکنیک “length()” در پردازش رشته تعیین کنیم.

نحو برای تبدیل Dataframe به رشته

نحو برای بدست آوردن طول مقادیر رشته ارائه شده در یک ستون

مثال 1: با استفاده از applicationmap(str) Dataframe را به رشته تبدیل کنید

در پایتون، روش های ساخته شده زیادی برای کار با رشته ها وجود دارد. هر یک از این روش ها یک مقدار جدید را بدون تغییر رشته اصلی برمی گرداند. برای مقادیر رشته، از نوع داده “object” استفاده می شود. در پاندای پایتون، از نوع داده متنی به عنوان “رشته” یا “شیء” یاد می شود. یک رشته ممکن است شامل یک عبارت کلمه باشد یا می تواند یک عدد نیز باشد. در این مثال، از “applymap(str)” برای تبدیل کل دیتافریم به یک نوع رشته استفاده می کنیم. از “apply(str)” برای تبدیل اعداد صحیح به رشته ها استفاده می شود و از applicationamap(str) برای تبدیل کل دیتافریم به رشته استفاده می شود.

بیایید اکنون در مورد اجرای کد خود صحبت کنیم. برای اجرای کد خود از ابزار “spyder” استفاده کردیم. کتابخانه Pandas ابتدا باید به عنوان “pd” وارد شود. سپس دیتافریم خود را می سازیم. دیتافریم «داده» نام دارد. ما سه ستون در این دیتافریم داریم «دوره»، «هزینه» و «ساعت اعتبار». اکنون این ستون ها دارای مقادیر خاصی هستند که به آنها اختصاص داده شده است. ما لیستی از دوره های “Python”، “OOP”، “Virtual_ Studio” و “Java” را در ستون “course” داریم. مقادیر ستون «کارمزد»، «35000»، «30000»، «20000» و «15000» و در ستون آخر «اعتبار_ساعت»، «3»، «4»، «3» و «است. 3”. بنابراین، “pd.dataframe” برای ایجاد چارچوب داده استفاده می شود. در این تصویر، ما همچنین “انواع داده” برنامه خود را با استفاده از تابع “print()” با “df” نمایش می دهیم. انواع داده». در اصل، “df.datatypes” برای ایجاد یک نوع داده برای یک دیتافریم استفاده می شود.

اکنون به سمت هدف اصلی برنامه خود می رویم. برای تبدیل دیتافریم به رشته، از df.applymap(str) استفاده می کنیم. با استفاده از روش “applymap()” یک تابع را می توان دو بار به هر عنصر دیتافریم اعمال کرد. در پانداها، “str” ​​بیشتر برای بازیابی مقادیر دیتافریم ها یا سری ها استفاده می شود. آنچه در این برنامه اتفاق می افتد این است که این تابع انواع داده ها را از انواع داده های “عدد صحیح” به “رشته” تبدیل می کند. با فراخوانی تابع print() ، اکنون دیتافریم و انواع داده های آن را پس از استفاده از “applymap(str) نمایش می دهیم.

دو دیتافریم با انواع داده در تصویر خروجی برنامه ما نمایش داده می شود. در دیتافریم دوم می بینیم که با تغییر نوع داده، دیتافریم را به رشته ای تبدیل کرده است. انواع داده های عدد صحیح اکنون به عنوان انواع داده های “شی” نشان داده می شوند. برای رشته، از “object” به عنوان نوع داده استفاده می کنیم. این نوع داده رشته ای “شیء” به آن اجازه می دهد که یک مقدار، عدد یا جمله واحد باشد. در اولین دیتافریم، انواع داده‌ها برای ستون‌های «Fee» و «Credit_hour» اعداد صحیح بودند. با این حال، پس از تبدیل به رشته، انواع داده برای این ستون ها به عنوان “اشیاء” نمایش داده می شود. در نهایت، “dtype: object” را نمایش می دهد که نشان می دهد به یک رشته تبدیل شده است.

مثال 2: تبدیل مقادیر ستون به نوع رشته با استفاده از تابع “astype()”

در این مثال، یک نوع داده از یک ستون به یک نوع “رشته ای” تبدیل می شود. در مثال قبلی، کل دیتافریم به رشته تبدیل شد، در حالی که در این حالت، تنها یک ستون به رشته تبدیل می شود. ما ستون را با استفاده از تابع “astype()” به نوع رشته تبدیل کردیم. تابع “astype()” در پانداها در درجه اول زمانی استفاده می شود که بخواهیم یک نوع داده را به نوع داده دیگری تبدیل کنیم. با این حال، روش های جایگزین دیگری در پایتون برای تغییر همزمان یک یا چند نوع داده وجود دارد.

حالا کد نویسی را شروع کنید. کتابخانه Pandas ابتدا باید به عنوان “PD” وارد شود. مرحله زیر شامل ایجاد چارچوب داده با همان نام “داده” از مرحله قبل است. این دیتافریم دارای چهار ستون «دوره»، «هزینه»، «مدت» و «تخفیف» است. برای هر یک از این ستون ها، مقادیر خاصی را فهرست کرده ایم. مقادیر در ستون اول به شرح زیر است: “Java”، “Graphic_desiging”، “Android_studio” و “OOP”. در ستون دوم، «هزینه‌ها»، «20000»، «21000»، «20000» و «24000» داریم. مقادیر “1_month”، “2_month” و “3_month” را در ستون سوم، “Duration” و در ورودی نهایی، تخفیف “20٪” و “30٪” برای دوره ها داریم. سپس دیتافریم با استفاده از “pd.dataframe” تولید می شود. اکنون دیتافریم با استفاده از تابع “print()” روی صفحه نمایش داده می شود و انواع داده های آن نیز با استفاده از دستور “df.dtypes” چاپ می شوند.

اکنون از تابع astypes() برای تبدیل ستون خاص به رشته استفاده می کنیم. با “astype()” و پارامترهای نام ستون “Charges” و نوع داده “string” در داخل آن، در این مورد ستون “Charges” را به یک رشته تبدیل می کنیم. اکنون، تابع “print()” را برای نمایش نتایج روی صفحه اعمال می کنیم.

همانطور که می بینیم، نوع داده برای ستون “Charge” در حالت اول “int64” است، به این معنی که مقادیر در ستون اعداد صحیح هستند، اما زمانی که ستون به یک رشته تبدیل شد، یک “رشته” در نشان داده شد. جلوی “Charge” به عنوان یک نوع داده. نوع داده برای یک رشته در پایتون یک “شی” است و از آنجایی که سه ستون باقیمانده رشته هستند، این نشان می دهد که اکنون کل دیتافریم به رشته تبدیل می شود.

مثال 3: تعیین طول رشته برای یک ستون خاص در یک DataFrame

در این مثال، طول هر مقدار رشته را برای یک ستون خاص در دیتافریم تعیین می کنیم. با استفاده از تابع “length()” می توانیم طول مقادیر رشته را تعیین کنیم. این روش برای تعیین کل کاراکترهای یک رشته ورودی استفاده می شود.

پس از وارد کردن کتابخانه Pandas برای شروع سومین مثال مقاله خود، باید با استفاده از “pd.dataframe” یک دیتافریم با سه ستون مانند مثال قبلی بسازیم. “Student_Name”، “Roll_Number” و “Total_Marks” به عنوان ستون در دسترس هستند. این ستون ها با مقادیری فهرست شده اند. «آلبرت»، «جان»، «آوا»، «الیور» و «آملیا» در ستون اول فهرست شده‌اند، در حالی که شماره‌های رول آنها در ستون دوم به‌عنوان «1»، «2»، «3»، « 4 و 5. و در ستون پایانی، به ترتیب علامت های نهایی “498”، “470”، “444”، “390” و “489” را ارائه می دهیم. اکنون که عبارت “Dataframe” چاپ شده است، از تابع “print()” برای نمایش دیتافریم در زیر آن استفاده می کنیم.

پس از این، یک خط دستور را نمایش می دهیم که می گوید: “محاسبه طول رشته در یک ستون” و با استفاده از تابع “length()” آن را محاسبه می کنیم. ما می توانیم از چارچوب داده خود مشاهده کنیم که ستون “Student_Name” حاوی مقادیر رشته ای است تا بتوانیم طول مقادیر آن را تعیین کنیم. ما از این ستون استفاده می کنیم. بنابراین، ما از “df[Student Name]” با “apply(len)”. این اعداد کل هر یک از مقادیر این ستون را اضافه می کند، که سپس به عنوان یک ستون جدید در قالب داده با نام “Student_Name_Length” نمایش داده می شود. بیایید در حال حاضر به نتایج آن بپردازیم.

همانطور که می بینید دو دیتافریم در اینجا نمایش داده می شود. دیتافریم دوم دارای یک ستون اضافی به نام “Student_Name_Length” است و همانطور که می بینیم، تعداد کل کلمات را محاسبه کرده و در آنجا نمایش می دهد. به عنوان مثال، نام “آلبرت” در مجموع دارای 6 کاراکتر است. این نشان می دهد که این تابع در برنامه ما با موفقیت عمل می کند.

نتیجه

پانداها روش های مختلفی را برای تبدیل یک دیتا فریم به رشته ارائه می کنند. کل دیتافریم ممکن است با استفاده از “applymap(str)” به رشته ای تبدیل شود که نوع داده را عدد صحیح به رشته تبدیل می کند. محاسبه کاراکترهای مقادیر رشته در یک ستون با استفاده از روش “length()” نیز بسیار مفید است. اگر بخواهیم چندین مقدار واحد را محاسبه کنیم، این تکنیک پانداها ما را ساده می کند. اگر استراتژی‌های کوچک و ساده را به کار ببریم، کار برای ما ساده‌تر خواهد بود. ما پیش‌بینی می‌کنیم که اگر از این استراتژی‌ها به‌طور مؤثر استفاده کنیم، کار ما بسیار ساده خواهد بود.


به این مطلب امتیاز دهید

جهت ارسال نظر اینجا کلیک کنید.