Skip to content

Software-Guardians/Python-Basic-Template-4

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 Data Science Assignment - NumPy and Pandas Applications / Veri Bilimi Ödevi - Numpy ve Pandas Uygulamaları

🇺🇸 English | 🇹🇷 Türkçe


🇺🇸 English {#english}

This project is a comprehensive educational assignment aimed at teaching fundamental data science operations using NumPy and Pandas libraries.

👨‍💻 Project Owner

Emrullah Enis Çetinkaya
Member of Software-Guardians organization

📋 Content

🔢 NumPy Section

1. Matrix Operations
  • Creating a 5x5 matrix with random numbers
  • Statistical calculations:
    • Mean
    • Standard deviation
    • Variance
    • Minimum and maximum values
    • Sum of diagonal elements (trace)
2. Data Simulation
  • Simulation of exam scores for 1000 students
  • Realistic data generation using normal distribution
  • Statistical analysis and failure rate calculation

🐼 Pandas Section

Sample student dataset:

Student Age Department Math Physics Chemistry
Ali 20 Computer 70 65 80
Ayşe 21 Physics 60 75 85
Mehmet 19 Chemistry 80 70 65
Zeynep 22 Computer 90 85 95
Ahmet 20 Physics 55 60 70
Applied Operations:
  • ✅ DataFrame creation and data loading
  • 📊 Subject-based average scores
  • 🏆 Finding student with highest math score
  • ➕ Grade point average calculation (adding new column)
  • 📈 Department-based group analyses
  • 🔍 Filtering successful students (average > 70)

🚀 Usage

Required Libraries

import numpy as np
import pandas as pd

Installation

pip install numpy pandas

Running

  1. Start Jupyter Notebook:
jupyter notebook
  1. Open veri_bilimi_odevi.ipynb file

  2. Run cells sequentially

📁 File Structure

Python-Basic-Template-4/
├── veri_bilimi_odevi.ipynb    # Main notebook file
├── ogrenciler.csv             # Sample dataset
├── README.md                  # This file
└── requirements.txt           # Required libraries

🎯 Learning Objectives

With this project, you will learn:

  • NumPy: Matrix operations, statistical calculations, data simulation
  • Pandas: DataFrame creation, data manipulation, grouping and filtering
  • Data Analysis: Basic statistical analyses and visualization preparation

📊 Results

NumPy Outputs:

  • 5x5 random matrix created
  • 1000 student scores simulated
  • Failure rate calculated

Pandas Outputs:

  • Average scores found for each subject
  • Zeynep identified as having the highest math score
  • Department-based success analyses performed
  • 4 students had averages above 70

🤝 Contributing

  1. Fork this repository
  2. Create a new feature branch (git checkout -b feature/new-feature)
  3. Commit your changes (git commit -am 'Add new feature')
  4. Push to the branch (git push origin feature/new-feature)
  5. Create a Pull Request

📜 License

This project is licensed under the MIT License. See the LICENSE file for details.

📞 Contact

Emrullah Enis Çetinkaya


⭐ Don't forget to star if you find this project useful!

🔗 Related Resources


🇹🇷 Türkçe {#türkçe}

Bu proje, NumPy ve Pandas kütüphaneleri kullanılarak temel veri bilimi işlemlerini öğretmeyi amaçlayan kapsamlı bir eğitim ödevidir.

👨‍💻 Proje Sahibi

Emrullah Enis Çetinkaya
Software-Guardians organizasyonu üyesi

📋 İçerik

🔢 NumPy Bölümü

1. Matris İşlemleri
  • 5x5 boyutunda rastgele sayılar içeren matris oluşturma
  • İstatistiksel hesaplamalar:
    • Ortalama (mean)
    • Standart sapma (standard deviation)
    • Varyans (variance)
    • Minimum ve maksimum değerler
    • Köşegen elemanları toplamı (trace)
2. Veri Simülasyonu
  • 1000 öğrencinin sınav puanları simülasyonu
  • Normal dağılım kullanarak gerçekçi veri üretimi
  • İstatistiksel analiz ve başarısızlık oranı hesaplama

🐼 Pandas Bölümü

Örnek öğrenci veri seti:

Öğrenci Yaş Bölüm Matematik Fizik Kimya
Ali 20 Bilgisayar 70 65 80
Ayşe 21 Fizik 60 75 85
Mehmet 19 Kimya 80 70 65
Zeynep 22 Bilgisayar 90 85 95
Ahmet 20 Fizik 55 60 70
Uygulanan İşlemler:
  • ✅ DataFrame oluşturma ve veri yükleme
  • 📊 Ders bazında ortalama puanlar
  • 🏆 En yüksek matematik notu alan öğrenci bulma
  • ➕ Not ortalaması hesaplama (yeni sütun ekleme)
  • 📈 Bölüm bazında grup analizleri
  • 🔍 Başarılı öğrencileri filtreleme (ortalama > 70)

🚀 Kullanım

Gerekli Kütüphaneler

import numpy as np
import pandas as pd

Kurulum

pip install numpy pandas

Çalıştırma

  1. Jupyter Notebook'u başlatın:
jupyter notebook
  1. veri_bilimi_odevi.ipynb dosyasını açın

  2. Hücreleri sırasıyla çalıştırın

📁 Dosya Yapısı

Python-Basic-Template-4/
├── veri_bilimi_odevi.ipynb    # Ana notebook dosyası
├── ogrenciler.csv             # Örnek veri seti
├── README.md                  # Bu dosya
└── requirements.txt           # Gerekli kütüphaneler

🎯 Öğrenme Hedefleri

Bu proje ile şunları öğreneceksiniz:

  • NumPy: Matris işlemleri, istatistiksel hesaplamalar, veri simülasyonu
  • Pandas: DataFrame oluşturma, veri manipülasyonu, gruplama ve filtreleme
  • Veri Analizi: Temel istatistiksel analizler ve görselleştirme hazırlığı

📊 Sonuçlar

NumPy Çıktıları:

  • 5x5 rastgele matris oluşturuldu
  • 1000 öğrenci puanı simüle edildi
  • Başarısızlık oranı hesaplandı

Pandas Çıktıları:

  • Her ders için ortalama puanlar bulundu
  • Zeynep'in en yüksek matematik notuna sahip olduğu belirlendi
  • Bölüm bazında başarı analizleri yapıldı
  • 4 öğrencinin ortalaması 70'in üzerinde çıktı

🤝 Katkıda Bulunma

  1. Bu repo'yu fork edin
  2. Yeni bir feature branch oluşturun (git checkout -b feature/yeni-ozellik)
  3. Değişikliklerinizi commit edin (git commit -am 'Yeni özellik eklendi')
  4. Branch'inizi push edin (git push origin feature/yeni-ozellik)
  5. Pull Request oluşturun

📜 Lisans

Bu proje MIT lisansı altında lisanslanmıştır. Detaylar için LICENSE dosyasına bakın.

📞 İletişim

Emrullah Enis Çetinkaya


⭐ Bu projeyi faydalı bulduysanız yıldız vermeyi unutmayın!

🔗 İlgili Kaynaklar

About

📘 Veri Bilimi Ödevi – Numpy ve Pandas Uygulamaları

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published