Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 165 in /var/www/tg-me/post.php on line 75
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение | Telegram Webview: dsproglib/6530 -
Telegram Group & Telegram Channel
⭐️ Чек-лист: как правильно работать с pandas

Работаете с табличными данными?

Эти простые советы сэкономят вам время, память и нервы:

✔️ Используйте векторизацию вместо apply

Быстрее, короче, читаемее:
# Вместо apply
df["log"] = np.log(df["x"])


✔️ Считайте в столбцах, а не в цикле по строкам

Избавьтесь от .iterrows() — векторные операции эффективнее:
df["sum"] = df["a"] + df["b"]


✔️ Используйте `category` для колонок с повторяющимися строками

Существенно уменьшает потребление памяти:
df["country"] = df["country"].astype("category")


✔️ Загружайте только нужные данные

Не тратьте ресурсы на лишние строки и столбцы:
pd.read_csv("big.csv", usecols=["col1", "col2"], nrows=100_000)


✔️ Сохраняйте данные одним вызовом, а не в цикле

Сначала собираем — потом записываем:
df.to_csv("result.csv", index=False)


✔️ Контролируйте использование памяти

Проверяйте «тяжёлые» столбцы
df.memory_usage(deep=True)


Библиотека дата-сайентиста #буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥1😁1



tg-me.com/dsproglib/6530
Create:
Last Update:

⭐️ Чек-лист: как правильно работать с pandas

Работаете с табличными данными?

Эти простые советы сэкономят вам время, память и нервы:

✔️ Используйте векторизацию вместо apply

Быстрее, короче, читаемее:

# Вместо apply
df["log"] = np.log(df["x"])


✔️ Считайте в столбцах, а не в цикле по строкам

Избавьтесь от .iterrows() — векторные операции эффективнее:
df["sum"] = df["a"] + df["b"]


✔️ Используйте `category` для колонок с повторяющимися строками

Существенно уменьшает потребление памяти:
df["country"] = df["country"].astype("category")


✔️ Загружайте только нужные данные

Не тратьте ресурсы на лишние строки и столбцы:
pd.read_csv("big.csv", usecols=["col1", "col2"], nrows=100_000)


✔️ Сохраняйте данные одним вызовом, а не в цикле

Сначала собираем — потом записываем:
df.to_csv("result.csv", index=False)


✔️ Контролируйте использование памяти

Проверяйте «тяжёлые» столбцы
df.memory_usage(deep=True)


Библиотека дата-сайентиста #буст

BY Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение




Share with your friend now:
tg-me.com/dsproglib/6530

View MORE
Open in Telegram


Библиотека дата сайентиста | Data Science Machine learning анализ данных машинное обучение Telegram | DID YOU KNOW?

Date: |

The seemingly negative pandemic effects and resource/product shortages are encouraging and allowing organizations to innovate and change.The news of cash-rich organizations getting ready for the post-Covid growth economy is a sign of more than capital spending plans. Cash provides a cushion for risk-taking and a tool for growth.

At a time when the Indian stock market is peaking and has rallied immensely compared to global markets, there are companies that have not performed in the last 10 years. These are definitely a minor portion of the market considering there are hundreds of stocks that have turned multibagger since 2020. What went wrong with these stocks? Reasons vary from corporate governance, sectoral weakness, company specific and so on. But the more important question is, are these stocks worth buying?

Библиотека дата сайентиста | Data Science Machine learning анализ данных машинное обучение from us


Telegram Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
FROM USA