Telegram Group Search
#Data_Analysis

✳️ منابع مفید برای پیدا کردن مجموعه داده‌ها:

▪️اگر به دنبال مجموعه داده‌های مناسب برای تمرین مهارت‌های تحلیل داده‌تون می‌گردید، این منابع به شما کمک می‌کنند.

1️⃣ ChatGPT:
از ChatGPT درخواست مجموعه داده‌های خاص پروژه‌تون رو داشته باشید. فقط پروژه‌تون رو توضیح بدید و ChatGPT راهنمایی‌تون خواهد کرد.

2️⃣ Kaggle:
مکانی عالی برای پیدا کردن مجموعه داده‌های مختلف و شرکت در مسابقات.
🔗 لینک Kaggle

3️⃣ UCI Machine Learning Repository: مجموعه داده‌های گسترده برای یادگیری ماشین و تحلیل داده‌ها.
🔗 لینک UCI

4️⃣ Data. gov:
پورتال داده‌های آزاد دولت ایالات متحده با مجموعه داده‌هایی از بخش‌های مختلف مانند بهداشت، آموزش و محیط زیست.
🔗 لینک Data.gov

5️⃣ Google Dataset Search:
ابزار قدرتمند برای پیدا کردن مجموعه داده‌ها از سراسر وب.
🔗 لینک Google Dataset

6️⃣ Awesome Public Datasets on GitHub:
فهرستی از مجموعه داده‌های جالب در GitHub.
🔗 لینک GitHub

7️⃣ FiveThirtyEight:
این سایت که برای داستان‌های آماری معروف است، مجموعه داده‌هایی که در مقالاتش استفاده کرده را به اشتراک می‌گذارد.
🔗 لینک FiveThirtyEight

8️⃣ World Bank Open Data:
دسترسی به داده‌های توسعه جهانی شامل آمار مالی، اقتصادی، آموزشی و بهداشتی.
🔗 لینک World Bank

9️⃣ IMDB:
یک روش جالب برای تمرین تحلیل داده‌ها با استفاده از داده‌های فیلم. برای پروژه‌هایی که شامل تحلیل متن و بصری‌سازی هستند عالی است.
🔗 لینک IMDB

🔟 Awesome Data Science Datasets:
یک مخزن GitHub دیگر با لیستی جامع از منابع داده.
🔗 لینک Awesome Datasets

🏫 @DataScience_School
🌐 http://dsstalent.com
#فرصت_شغلی استخدام "کارشناس هوش تجاری"

گروه صنعتی پویش پژوهان فعال در حوزه طراحی و ساخت سیستم‌های پیشرفته صنعتی، از افراد واجد شرایط برای موقعیت کارشناس هوش تجاری دعوت به همکاری می‌کند.

◾️ برای ارسال رزومه و دریافت اطلاعات بیشتر، از طریق اطلاعات موجود در تصویر اقدام فرمایید.

🏫 @DataScience_School
🌐 dsstalent.com
#فرصت_شغلی استخدام "Data Scientist"

دپارتمان داده خانومی | Khanoumi، بزرگ‌ترین فروشگاه اینترنتی محصولات آرایشی، بهداشتی و مراقبتی ایران، برای موقعیت Data Scientist اقدام به جذب نیرو می‌نماید.

◾️ جهت مشاهده شرح شغل و ارسال رزومه، می‌توانید به لینک زیر مراجعه کنید:

🔗https://buff.page.link/9gQn

🏫 @DataScience_School
🌐 dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#Power_BI

💥 آپدیت جدید Power BI

از این پس می‌توانید خلاصه‌های تولید شده توسط Copilot را در اشتراک‌های ایمیل Power BI خود دریافت کنید! این ویژگی به صورت خودکار نکات کلیدی گزارش‌ها را خلاصه کرده و در ایمیل ارسال می‌کند تا در زمان شما صرفه‌جویی شود و بهره‌وری افزایش یابد.

📌 ویژگی‌ها:

▪️خلاصه‌سازی خودکار برای نمایش نکات کلیدی گزارش‌ها.

▪️راهی سریع و کارآمد برای همیشه به‌روز بودن.


💡 پیش‌نیاز:
برای استفاده از Copilot در پاور بی آی به لایسنس Microsoft Fabric نیاز دارید.

🏫 @DataScience_School
🌐 dsstalent.com
#Python
#Data_analytics

❇️ نکات طلایی برای کدنویسی پایتون در تحلیل داده‌ها

▪️ یکی از سوالات پرتکرار علاقه‌مندان و متخصصان تحلیل داده این است: چطور بر پایتون مسلط شویم؟
برای پاسخ به این سوال، پنج راهکار کلیدی وجود دارد که می‌تواند مسیر یادگیری شما را هموارتر و کاربردی‌تر کند:

📍 یادگیری کتابخانه‌های اصلی پایتون:
مهم‌ترین کتابخانه‌های پایتون برای تحلیل داده:

▪️Pandas -> برای کار با DataFrame
▪️NumPy -> برای محاسبات عددی
▪️Matplotlib/Seaborn -> برای مصورسازی
▪️Scikit-learn -> برای یادگیری ماشین


📍 درک مفاهیم پایه:
مفاهیم کلیدی مثل List Comprehensions، توابع Lambda، برنامه‌نویسی شیءگرا و مدیریت خطا برای نوشتن کدی کارآمد.

📍 استفاده از روش‌های حل مسئله:
به کارگیری تکنیک‌های پاکسازی داده، حلقه‌های بهینه و عملیات برداری در NumPy و Pandas برای افزایش کارایی.

📍 اجرای پروژه‌های شبیه‌سازی:
کار روی پروژه‌های کامل از بارگذاری داده تا پاکسازی، تحلیل و مصورسازی.

📍 درس گرفتن از پروژه‌های گذشته:
کدهای قبلی خود را مرور کنید و به دنبال راه‌هایی برای بهینه‌تر کردن آن‌ها باشید.

🏫 @DataScience_School
🌐 Http://dsstalent.com
#Python

❇️چرا نمودارهای Box Plot و Histogram می‌توانند گمراه‌کننده باشند؟

▪️دو مجموعه داده‌ی کاملاً متفاوت می‌توانند یک Box Plot یکسان تولید کنند.
▪️تغییر تعداد binها در Histogram شکل نمودار را تغییر می‌دهد.

🔹 برای جلوگیری از نتیجه‌گیری‌های اشتباه، همیشه بهتر است داده‌ها را با دقت بیشتری نمایش دهیم. یکی از روش‌های مفید، استفاده از Raincloud Plot است که سه نوع نمودار را ترکیب می‌کند:

▪️Box Plot برای نمایش آمار داده‌ها
▪️Strip Plot برای نمایش کلی داده‌ها
▪️KDE Plot برای نمایش توزیع احتمالاتی داده‌ها

مزایای Raincloud Plot:
▪️جلوگیری از تفسیر نادرست داده‌ها
▪️کاهش شلوغی بصری و افزایش وضوح
▪️بهبود مقایسه بین گروه‌های مختلف
▪️نمایش جنبه‌های مختلف داده در یک نمودار

🏫 @DataScience_School
🌐 Http://dsstalent.com
#Power_BI

🚀 ترفند سریع در Power Query!

▪️اگر می‌خواهید چندین ستون را در یک ستون ادغام کنید، فقط با یک مرحله این کار را انجام دهید! 👇
= Table.FromList(
List.RemoveNulls(
List.Combine(
Table.ToColumns(Source))
),
null,
{"Names"}
)

تمام مقادیر ستون‌ها را در یک ستون ادغام می‌کند
به‌طور خودکار مقادیر null را حذف می‌کند

🔥این روش را امتحان کنید و پردازش داده‌های خود را ساده‌تر کنید!

🏫 @DataScience_School
🌐 Http://dsstalent.com
#فرصت_تحصیلی

🎓 فرصت پژوهشی مقطع کارشناسی ارشد در دانشگاه کارولینای شمالی در شارلوت، آمریکا

🔹 رشته‌های مورد پذیرش:
• علوم داده
• مهندسی ساخت و تأسیسات
• ایمنی و بهداشت شغلی

📌 درباره موقعیت:
گروه مهندسی ساخت و تأسیسات دانشگاه UNCC به دنبال جذب یک دانشجوی کارشناسی ارشد برای انجام پژوهش در حوزه ایمنی و بهداشت کارگران ساختمانی است. این پروژه شامل تحلیل داده و مدل‌سازی با استفاده از مجموعه داده‌های موجود است.

📊 حوزه‌های تحقیقاتی:
• تحلیل داده‌محور در ایمنی و بهداشت
• مدل‌سازی آماری و یادگیری ماشین
• تحلیل شبکه‌های اجتماعی و پایگاه داده در صنعت ساخت‌وساز

📝 فرآیند درخواست:
• ارسال رزومه و انگیزه‌نامه (حداکثر ۵۰۰ کلمه) به ایمیل:
📩 [email protected]

• موضوع ایمیل: "RA_Dissertation_S25"

💡 فرصتی عالی برای علاقه‌مندان به پژوهش در حوزه مهندسی و علوم داده!

🏫 @DataScience_School
🌐 Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#SQL

❇️یک SQL Mindmap بسیار عالی برای علاقمندان به حوزه تحلیل داده و هوش تجاری

پرکاربردترین دستورات SQL برای تحلیل داده:
Aggregate Calculation (مثل Sum، Count، Max و Min)
Group By و Having
Join (Left Join، Right Join، Inner Join و Full Join)
SubQuery و Temporary Table
As، Where و Order By



🏫 @DataScience_School
🌐 dsstalent.com
#فرصت_شغلی استخدام "BI Developer"

اسنپ باکس برای موقعیت شغلی BI developer اقدام به جذب نیرو می‌نماید.

◾️ جهت مشاهده شرح شغل و ارسال رزومه، می‌توانید به لینک زیر مراجعه کنید:

🔗https://buff.page.link/P5QQ

🏫 @DataScience_School
🌐 dsstalent.com
#Python
#DataVisualization

❇️چرا استفاده از Bar Chart برای نمایش تغییر جایگاه رقبا در طول زمان مناسب نیست؟

▪️با افزایش تعداد دسته‌ها، Bar Chart به‌سرعت شلوغ و نامفهوم می‌شود.
▪️مقایسه‌ی تغییر رتبه در یک نمودار میله‌ای دشوار است.
🔹 به جای آن، از Bump Chart استفاده کنید. این نمودار مخصوص نمایش تغییر رتبه‌ی آیتم‌های مختلف در طول زمان است و خوانایی بسیار بهتری دارد.

مزایای Bump Chart:
▪️بهبود وضوح مقایسه‌ی تغییر رتبه‌ها
▪️کاهش شلوغی بصری و افزایش خوانایی
▪️مناسب برای نمایش روند رتبه‌بندی در طول زمان
🏫 @DataScience_School
🌐 Http://dsstalent.com
#SQL

📌 آیا تفاوت‌های معماری‌های داده را می‌شناسید؟

➡️ Database
➡️ RDBMS
➡️ Data Warehouse
➡️ Data Lake
➡️ Data Lakehouse

نگران نباشید! در ادامه توضیحات هر کدام مختصر آورده شده است:

🗂 Database (1960-1970) – محیطی ساختارمند برای ذخیره، مدیریت و دسترسی به داده‌ها.

📊 Relational Database (1970-1990) – سیستم پایگاه داده‌ای که داده‌ها را در جداول مرتبط با یکدیگر نگه می‌دارد (SQL).

🏢 Data Warehouse (1980-2010) – فضایی بهینه‌شده برای تحلیل داده‌ها، با ساختاری مشخص و قابل استفاده برای هوش تجاری.

🌊 Data Lake (2010-2020) – مخزن داده‌ای که اطلاعات خام را در قالب‌های مختلف ذخیره می‌کند و انعطاف‌پذیری بیشتری نسبت به انبارداده دارد

🏠 Data Lakehouse (2020-حال) – ترکیبی از انعطاف‌پذیری دیتا لیک و ساختار منظم انبارداده، با قدرت تحلیل بالا

👀 در ادامه درباره هر کدام از معماری‌ها بیشتر پست گذاشته خواهد شد.

موفق باشید

🏫 @DataScience_School
🌐 dsstalent.com
#فرصت_شغلی: استخدام "تحلیل‌گر ارشد داده‌های قیمت‌گذاری"

اسنپ، "تحلیل‌گر ارشد داده‌های قیمت‌گذاری" (product managerSenior Pricing Data Analyst) استخدام می‌نماید.

◾️برای مشاهده ی شرایط شغلی و ارسال رزومه از طریق لینک زیر اقدام نمایید:

🔗https://buff.page.link/gPVw

🏫 @DataScience_School
🌐Http://dsstalent.com
#DataScience #Course

❇️ یک فرصت عالی برای دیتاساینتیست‌ها و علاقه‌مندان به هوش مصنوعی!

📅 از ۳۱ مارچ تا ۴ آپریل، در دوره آنلاین فشرده ۵ روزه Google برای Generative AI شرکت کنید — رایگان، با محتوای جدید، سخنران‌های مطرح و یک پروژه عملی در Kaggle برای تقویت رزومه شما.

🔸 این دوره برای کمک به دیتاساینتیست‌ها و توسعه‌دهندگان طراحی شده تا درک عمیقی از مدل‌های زبانی بزرگ (LLMs)، جاسازی‌ها (Embeddings)، ایجنت‌های هوش مصنوعی و MLOps مخصوص GenAI پیدا کنند.

📚 هر روز:
▪️ منابع آموزشی
▪️ پادکست و کدلب‌های همراه
▪️ بحث و گفتگو با متخصصین در Discord
▪️ لایوهای آموزشی و جلسات AMA در یوتیوب Kaggle

در انتها هم با انجام پروژه نهایی، می‌تونید شانس کسب گواهی‌نامه، جوایز ویژه و معرفی در شبکه‌های اجتماعی گوگل و Kaggle رو داشته باشید!

🌐 برای اطلاعات بیشتر و ثبت‌نام:
https://rsvp.withgoogle.com/events/google-generative-ai-intensive_2025q1

🏫 @DataScience_School
🌐 Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#PowerBI

❇️ ایجاد نوار پیشرفت متحرک در Power BI با Card Visual جدید!

📊 آیا می‌دانستید که می‌توانید با استفاده از قابلیت جدید Card Visual در Power BI، یک Progress Bar متحرک ایجاد کنید؟

🔹 این تکنیک می‌تواند داشبوردهای شما را دینامیک‌تر و جذاب‌تر کند و به کاربران تجربه بصری بهتری ارائه دهد.

📂 نمونه آماده برای تست و یادگیری:
🔗 دانلود فایل PBIX

🏫 @DataScience_School
🌐 Http://dsstalent.com
✳️بهترین کانال‌های یوتیوب برای یادگیری تحلیل داده

SQL
▪️ Intellipaat -از مقدماتی تا پیشرفته
▪️ sqlbelle – نکات و ترفندهای کاربردی
▪️ Amit Thinks - مخصوص مبتدی‌ها

Python
▪️ Programming with Mosh – آموزش کامل و عملی
▪️ Bro Code- یادگیری ساده و سریع
▪️ TechWorld with Nana – تمرکز بر DevOps و Data Engineering

Excel
▪️ ExcelIsFun – فرمول‌ها و تکنیک‌های عمیق
▪️ Chandoo – داشبوردها و خودکارسازی
▪️ Excel Campus – آموزش‌های حرفه‌ای

Power BI
▪️ Microsoft Power BI – کانال رسمی
▪️ Guy in a Cube – آموزش‌های کامل DAX، Power Query
▪️ PowerBI Tips - نکات حرفه ای

Tableau
▪️ Tableau – کانال رسمی
▪️ Tableau Tim – آموزش‌های کاربردی برای همه سطوح
▪️ Penguin Analytics – تکنیک‌های پیشرفته و داستان‌سرایی داده

Statistics
▪️ StatQuest with Josh Starmer – توضیح مفاهیم پیچیده به زبان ساده
▪️ Mike Crowson – آمار کاربردی
▪️ Professor Knudson – سخنرانی‌های دانشگاهی درباره آمار و احتمال

مفاهیم تحلیلی
▪️ edureka! – دوره‌های دیتاساینس و یادگیری ماشین
▪️ FreeCodeCamp.org – آموزش‌های کامل

🏫 @DataScience_School
🌐 Http://dsstalent.com
#موقعیت_شغلی

❇️شرکت طراحی و مهندسی قطعات کرمان خودرو، توسعه‌دهنده هوش تجاری (BI Developer) استخدام می‌نماید.

مسئولیت‌ها:

▪️طراحی و ساخت داشبوردهای تحلیلی با Power BI، Superset و ابزارهای مشابه
▪️توسعه مدل‌های OLAP Tabular در SSAS
▪️طراحی و اجرای فرآیندهای ETL با SSIS
▪️بهینه‌سازی گزارش‌ها با SSRS
▪️تحلیل و مدل‌سازی داده‌ها از منابع مختلف
▪️مدیریت سطوح دسترسی کاربران و امنیت داده
▪️مستندسازی فرآیندها و خروجی‌های BI

مهارت‌ها و الزامات:

▪️مدرک کارشناسی در رشته‌های مرتبط (مهندسی نرم‌افزار، آمار، اقتصاد و...)
▪️حداقل ۳ سال تجربه حرفه‌ای در حوزه BI
تسلط کامل بر SSIS، SSRS، SSAS (OLAP Tabular)
▪️مهارت بالا در SQL و کوئری‌نویسی پیشرفته
▪️آشنایی با زبان‌های Python یا R مزیت محسوب می‌شود
▪️آشنایی با مفاهیم پیشرفته BI و Big Data امتیاز محسوب می‌شود

علاقه مندان می تواند رزومه خود را از طریق آدرس ایمیل زیر ارسال نمایند:
📧 [email protected]

🏫 @DataScience_School
🌐Http://dsstalent.com
#storytelling

✳️مهارتی کلیدی در تحلیل داده که کمتر به آن توجه می‌شود: انتخاب نمودار مناسب

🔹نحوه‌ی نمایش داده‌ها تأثیر مستقیمی بر درک مخاطب دارد.
🔹انتخاب نمودار صحیح نه تنها باعث وضوح بیشتر می‌شود، بلکه به انتقال دقیق پیام نیز کمک می‌کند.

🔹هدف از نمایش داده، انتقال بینش است، نه صرفاً نمایش اطلاعات.

🔹تسلط بر این مهارت، بخشی از توانایی Data Storytelling حرفه‌ای است؛
یعنی دانستن اینکه هر نمودار، در چه زمانی و با چه هدفی باید به‌کار رود.

🔹یادگیری اصول انتخاب نمودار، نقطه‌ی شروعی مؤثر برای بهبود ارتباط داده‌ای و تصمیم‌سازی بهتر است.

🏫 @DataScience_School
🌐Http://dsstalent.com
#Power_BI

❇️لایه‌های چهارگانه مشکلات هوش تجاری

▪️در بسیاری از سازمان‌ها، فقط به لایه سطحی مشکلات داده‌ای پرداخته می‌شود در حالی‌که باید به مسائل در لایه‌های عمیق‌تری توجه نمود:

🔹 لایه سطحی: مشکلاتی مانند کندی بارگذاری داشبوردها، شاخص‌های کلیدی عملکرد (KPI) نادرست، یا خطاهای خروجی.

🔹 لایه ساختاری: ریشه بسیاری از ناپایداری‌ها را باید در زیرساخت‌های داده‌ای جست‌وجو کرد؛ از جمله پایپ‌لاین‌های ناپایدار و فرآیندهای ETL غیرقابل اطمینان

🔹 لایه استراتژیک: ناهماهنگی در تعریف شاخص‌ها میان تیم‌ها، جزیره‌ای بودن داده‌ها و نبود یکپارچگی میان سیستم‌های کلیدی، موجب می‌شود تصمیم‌گیران با تصویر ناقصی از وضعیت مواجه باشند.

🔹 لایه اصلی (Core Data): در عمیق‌ترین سطح، مشکلات به نبود حاکمیت داده، فقدان مالک داده و مشخص نبود تک سورس داده بازمی‌گردد.

👈 حل مسائل در لایه سطحی، به تکرار مداوم مشکلات منجر خواهد شد. برای ایجاد تحولی پایدار در استراتژی داده، باید از لایه Core Data آغاز کرد.

🧐سازمان شما در کدام لایه بیشتر با چالش مواجه است؟

🏫 @DataScience_School
🌐 Http://dsstalent.com
This media is not supported in your browser
VIEW IN TELEGRAM
#DAX
#Power_BI

❇️ نکته جالب درباره AVERAGEA در DAX!

🔹 برخلاف تصور، AVERAGEA فقط روی مقادیر یک ستون اعمال نمی‌شود، بلکه می‌تواند Measures را هم بپذیرد!

🔹 اگر ورودی آن یک Measure باشد، معادل فرمول زیر خواهد بود:
AVERAGEX('The Table Where the Measure Is', [Measure])

این یعنی نتیجه‌ی Measure به جدولی که در آن قرار دارد وابسته است!

🏫 @DataScience_School
🌐 Http://dsstalent.com
2025/06/14 07:02:17
Back to Top
HTML Embed Code: