📊 Data Science Assignment - NumPy and Pandas Applications / Veri Bilimi Ödevi - Numpy ve Pandas Uygulamaları
This project is a comprehensive educational assignment aimed at teaching fundamental data science operations using NumPy and Pandas libraries.
Emrullah Enis Çetinkaya
Member of Software-Guardians organization
- Creating a 5x5 matrix with random numbers
- Statistical calculations:
- Mean
- Standard deviation
- Variance
- Minimum and maximum values
- Sum of diagonal elements (trace)
- Simulation of exam scores for 1000 students
- Realistic data generation using normal distribution
- Statistical analysis and failure rate calculation
Sample student dataset:
Student | Age | Department | Math | Physics | Chemistry |
---|---|---|---|---|---|
Ali | 20 | Computer | 70 | 65 | 80 |
Ayşe | 21 | Physics | 60 | 75 | 85 |
Mehmet | 19 | Chemistry | 80 | 70 | 65 |
Zeynep | 22 | Computer | 90 | 85 | 95 |
Ahmet | 20 | Physics | 55 | 60 | 70 |
- ✅ DataFrame creation and data loading
- 📊 Subject-based average scores
- 🏆 Finding student with highest math score
- ➕ Grade point average calculation (adding new column)
- 📈 Department-based group analyses
- 🔍 Filtering successful students (average > 70)
import numpy as np
import pandas as pd
pip install numpy pandas
- Start Jupyter Notebook:
jupyter notebook
-
Open
veri_bilimi_odevi.ipynb
file -
Run cells sequentially
Python-Basic-Template-4/
├── veri_bilimi_odevi.ipynb # Main notebook file
├── ogrenciler.csv # Sample dataset
├── README.md # This file
└── requirements.txt # Required libraries
With this project, you will learn:
- NumPy: Matrix operations, statistical calculations, data simulation
- Pandas: DataFrame creation, data manipulation, grouping and filtering
- Data Analysis: Basic statistical analyses and visualization preparation
- 5x5 random matrix created
- 1000 student scores simulated
- Failure rate calculated
- Average scores found for each subject
- Zeynep identified as having the highest math score
- Department-based success analyses performed
- 4 students had averages above 70
- Fork this repository
- Create a new feature branch (
git checkout -b feature/new-feature
) - Commit your changes (
git commit -am 'Add new feature'
) - Push to the branch (
git push origin feature/new-feature
) - Create a Pull Request
This project is licensed under the MIT License. See the LICENSE
file for details.
Emrullah Enis Çetinkaya
- GitHub: @Software-Guardians
- Project: Python-Basic-Template-4
⭐ Don't forget to star if you find this project useful!
Bu proje, NumPy ve Pandas kütüphaneleri kullanılarak temel veri bilimi işlemlerini öğretmeyi amaçlayan kapsamlı bir eğitim ödevidir.
Emrullah Enis Çetinkaya
Software-Guardians organizasyonu üyesi
- 5x5 boyutunda rastgele sayılar içeren matris oluşturma
- İstatistiksel hesaplamalar:
- Ortalama (mean)
- Standart sapma (standard deviation)
- Varyans (variance)
- Minimum ve maksimum değerler
- Köşegen elemanları toplamı (trace)
- 1000 öğrencinin sınav puanları simülasyonu
- Normal dağılım kullanarak gerçekçi veri üretimi
- İstatistiksel analiz ve başarısızlık oranı hesaplama
Örnek öğrenci veri seti:
Öğrenci | Yaş | Bölüm | Matematik | Fizik | Kimya |
---|---|---|---|---|---|
Ali | 20 | Bilgisayar | 70 | 65 | 80 |
Ayşe | 21 | Fizik | 60 | 75 | 85 |
Mehmet | 19 | Kimya | 80 | 70 | 65 |
Zeynep | 22 | Bilgisayar | 90 | 85 | 95 |
Ahmet | 20 | Fizik | 55 | 60 | 70 |
- ✅ DataFrame oluşturma ve veri yükleme
- 📊 Ders bazında ortalama puanlar
- 🏆 En yüksek matematik notu alan öğrenci bulma
- ➕ Not ortalaması hesaplama (yeni sütun ekleme)
- 📈 Bölüm bazında grup analizleri
- 🔍 Başarılı öğrencileri filtreleme (ortalama > 70)
import numpy as np
import pandas as pd
pip install numpy pandas
- Jupyter Notebook'u başlatın:
jupyter notebook
-
veri_bilimi_odevi.ipynb
dosyasını açın -
Hücreleri sırasıyla çalıştırın
Python-Basic-Template-4/
├── veri_bilimi_odevi.ipynb # Ana notebook dosyası
├── ogrenciler.csv # Örnek veri seti
├── README.md # Bu dosya
└── requirements.txt # Gerekli kütüphaneler
Bu proje ile şunları öğreneceksiniz:
- NumPy: Matris işlemleri, istatistiksel hesaplamalar, veri simülasyonu
- Pandas: DataFrame oluşturma, veri manipülasyonu, gruplama ve filtreleme
- Veri Analizi: Temel istatistiksel analizler ve görselleştirme hazırlığı
- 5x5 rastgele matris oluşturuldu
- 1000 öğrenci puanı simüle edildi
- Başarısızlık oranı hesaplandı
- Her ders için ortalama puanlar bulundu
- Zeynep'in en yüksek matematik notuna sahip olduğu belirlendi
- Bölüm bazında başarı analizleri yapıldı
- 4 öğrencinin ortalaması 70'in üzerinde çıktı
- Bu repo'yu fork edin
- Yeni bir feature branch oluşturun (
git checkout -b feature/yeni-ozellik
) - Değişikliklerinizi commit edin (
git commit -am 'Yeni özellik eklendi'
) - Branch'inizi push edin (
git push origin feature/yeni-ozellik
) - Pull Request oluşturun
Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE
dosyasına bakın.
Emrullah Enis Çetinkaya
- GitHub: @Software-Guardians
- Proje: Python-Basic-Template-4
⭐ Bu projeyi faydalı bulduysanız yıldız vermeyi unutmayın!