CENDERAWASIH : Journal of Statistics and Data Science https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS Universitas Cenderawasih en-US CENDERAWASIH : Journal of Statistics and Data Science ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PENDAPATAN UMKM DI KECAMATAN JAYAPURA UTARA https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/45 <p>Penelitian ini bertujuan untuk mengetahui faktor-faktor yang mempengaruhi pendapatan UMKM di Kecamatan Jayapura Utara. Data yang digunakandalam penelitian ini merupakan hasial survei wawancara pelaku UMKM di Kecamatan Jayapura Utara. Metode yang digunakan yaitu analisis regresi logistik , uji kesesuaian model, dan uji ketepatan klasifikasi model. Hasil yang diperoleh yaitu model logistik . Dimana, apabila ada perubahan pada variabel lokasi modal, jam kerja, lama usaha, pendidikan terakhir, jenis kelamin dan jumlah tenaga kerja maka tidak akan ada perubahan pendapatan UMKM di Kecamatan Jayapura Utara. Dengan menggunakan taraf nyata 5%, maka diperoleh faktor-faktor yang mempengaruhi pendapatan UMKM di Kecamatan Jayapura Utara yaitu modal dan tenaga kerja, dimana model yang digunakan sesuai dan ketepatan klasifikasinya yaitu sebesar 79,7%.</p> Deviana Herawati Ockta Indriani Cahyaningtiyas Radian Januari Situmeang Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 46 55 PEMILIHAN METODE KLASIFIKASI TERBAIK ANTARA LOGISTIC REGRESSION DAN DECISION TREE PADA DATASET HEPATITIS https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/122 <p>Hepatitis merupakan penyakit peradangan pada hati yang dapat disebabkan oleh berbagai macam penyebab, termasuk infeksi virus atau paparan zat beracun. Penerapan proses <em>data mining</em> untuk mengekstrak informasi dari data medis dan klinis. Dengan menggunakan metode ini, kondisi pasien di masa depan dapat diprediksi berdasarkan observasi data pasien lain atau pasien masa lalu. Penelitian ini bertujuan untuk menerapkan proses data mining dan melakukan perbandigan metode klasifikasi yaitu <em>Logistic</em> <em>Regression </em>dan <em>Decision Tree</em> menggunakan dataset Hepatitis. Berdasarkan hasil perbandingan diperoleh nilai accuracy <em>Logistic</em> <em>Regression</em> sebesar 80,207%. Sedangkkan metode <em>Decision Tree</em> menghasilkan nilai accuracy sebesar 83,195%. Maka dapat disimpulkan bahwa hasil perbandingan metode terbaik yaitu <em>Decision Tree</em>.</p> Desi Rahmawati Aginda Ersita Maruruk Caecilia Bintang Girik Allo Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 56 61 PERBANDINGAN KINERJA MODEL LINEAR DISCRIMINANT ANALYSIS DAN DECISSION TREE PADA STUDI KASUS DATASET AUDIT DATA https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/124 <p>Penelitian ini akan membandingkan dua metode penambangan data yang umum digunakan, yaitu<em> Linear Discriminant Analysis </em>(LDA) dan <em>Decission Tree</em> dengan nilai <em>accuracy</em> 99,6% memiliki kinerja lebih baik dan relatif optimal pada <em>dataset</em> <em>audit data</em>. Dengan tujuan mengoptimalkan analisis statistik <em>audit data</em>, pengujian ini mengidentifikasi model mana yang lebih baik dan relatif optimal pada <em>dataset</em> <em>audit data</em>. Penelitian dilakukan untuk membandingkan performa <em>machine learning</em> dengan memilih subkumpulan fitur yan relevan dari data. Perbandingan dengan menggunnakan nilai <em>accuracy </em>menunjukkan jika model <em>Decission Tree </em>dan hasil <em>accuracy</em> sebesar 99,6%.</p> Wahyu Aprillia Sari Febryana D. Hanafi Halle F. P. Watory Muhammad Asghar Nazal Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 62 68 Clustering Kabupaten/Kota Di Provinsi Papua Berdasarkan Indikator Kemiskinan Menggunakan Metode K-Medoids https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/140 <p style="font-weight: 400;">Badan Pusat Statistik (BPS) telah merilis berbagai variabel terkait informasi kemiskinan tingkat kabupaten/kota di Indonesia pada tahun 2020. Angka kemiskinan tiap kabupaten/kota di Indonesia berbeda-beda. Perbedaan ini disebabkan oleh banyak indikator yang berbeda seperti: indeks pembangunan manusia, angka penduduk, pendapatan per kapita, angka melek huruf, akses terhadap pendidikan, akses terhadap air bersih dan kualitas yang cukup, dll. Sehingga digunakan metode <em>clustering</em> <em>K</em><em>-M</em><em>edoids</em> untuk mengelompokkan berdasarkan indikator-indikator tersebut. Algoritma <em>K</em><em>-</em><em>Medoids</em> merupakan salah satu metode <em>clustering</em> yang diusulkan untuk mengatasi kelemahan algoritma <em>K</em><em>-M</em><em>eans</em> yang sensitif terhadap outlier karena suatu objek dengan nilai yang tinggi dapat menyimpang secara signifikan dari sebaran datanya. Algoritm <em>K</em><em>-M</em><em>edoids</em> menggunakan data alih-alih merata-ratakan pusat cluster. Dengan menggunakan analisis <em>K-Medoids</em> diperoleh <em>cluster </em>optimal sebanyak 2 <em>cluster</em> yang dikategorikan sebagai Kabupaten/Kota dengan indikator kemiskinan sedang dan tinggi dari 29 kabupaten/kota, dimana pada cluster 1 dengan 17 Kabupaten/Kota tergolong kemiskinan tinggi karena pada <em>cluster</em> ini Indeks Pembangunan Manusia dan Laju Pertumbuhan PDRB tergolong rendah dan Persentase Penduduk Miskin tinggi.Untuk <em>cluster</em> 2 dengan 12 Kabupaten/kota tergolong kemiskinan sedang karena pada <em>cluster</em> ini Indeks Pembangunan Manusia dan Laju Pertumbuhan PDRB tinggi sedangkan Persentase Penduduk Miskin rendah. &nbsp;</p> Desi Rahmawati Aginda Ersita Maruruk Caecilia Bintang Girik Allo Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 69 74 CLUSTERING DATASET CUSTOMERS DENGAN MENGGUNAKAN METODE K-MEANS https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/141 <p>Keunggulan kompetitif yang berkelanjutan sangat penting bagi sebagian besar perusahaan yang ingin mempertahankan atau memperluas posisinya dan mengoptimalkan probabilitas dan pertumbuhan keuntungannya. Keunggulan yang baik adalah yang dapat menarik klien/pelanggan. Segmentasi pelanggan sangat penting untuk mencapai misi ini. Teknik clustering dapat membantu dalam pengelompokan pelanggan dalam membuat kelompok yang terdiri objek target berdasarkan informasi dalam data yang membedakan objek dan hubungan di antara objek tersebut. Dengan mengelompokkan pelanggan ke dalam beberapa kelompok dapat membedakan antara pelanggan yang lebih disukai dan yang kurang disukai. Pada hal ini kami menyelidiki masalah audit internal yang terkait dengan protokol dengan tujuan untuk melihat nilai yang diberikan oleh mall kepada customer berdasarkan perilaku customer. Algoritma clustering yang digunakan adalah algoritma K-means. Pada metode algoritma K-Means diperoleh jumlah cluster dengan metode elbow yaitu k = 2. Cluster yang terbentuk yaitu cluster 1 dengan jumlah 11 pelanggan yang dan cluster 2 dengan jumlah 14 pelanggan.</p> Rosy Latunusa Niswa Nilhaya M. Caecilia Bintang Girik Allo Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 75 79 ANALISIS PERBANDINGAN METODE FEATURE SELECTION BACKWARD METHOD DAN STEPWISE METHOD https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/142 <p style="font-weight: 400;"><em>Feature selection is an important process in the development of machine learning models to identify the most informative and relevant features in a dataset. Two commonly used methods for feature selection are the forward method and the backward method. In this research, a Data Mining feature selection technique is applied to compare the two Feature Selection methods, namely the Backward Method and the Stepwise Method, based on accuracy values. The results obtained from the comparison of accuracy values of Feature Selection, namely Backward Method and Stepwise Method, using the Students Performance dataset, show that both models are comparable. They are considered comparable because, based on their accuracy values, both the Backward Method and Stepwise Method have the same accuracy of 0.61 or 61%.</em></p> <p style="font-weight: 400;"><strong><em>Keywords:</em></strong><em> Comparison, Feature Selection, Backward Method, Stepwise Method.</em></p> Natasya Parenden Nurfadillah Maria F. Barek Bunga Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 80 82 ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PEMBANGUNAN MANUSIA DI PROVINSI PAPUA MENGGUNAKAN REGRESI DATA PANEL https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/152 <p>Secara umum pembangunan merupakan suatu proses perubahan ke arah yang lebih baik . Upaya tersebut dilakukan secara terencana dengan tujuan untuk meningkatkan kesejahteraan masyarakat. Dalam upaya&nbsp; mencapai tujuan pembangunan tersebut akan selalu ada dampak yang&nbsp; baik, dampak positif dan negatif. Oleh karena itu, perlu adanya indikator sebagai acuan bila terjadi perkembangan ini. Penelitian bertujuan untuk mengetahui faktor-faktor yang mempengaruhi indeks pembangunan manusia di Provinsi Papua dan menentukan model regresi data panel yang terbaik untuk menganalisis faktor-faktor yang mempengaruhi indeks pembangunan di Provinsi Papua. Berdasarkan hasil pengujian model regresi data panel menggunakan <em>Uji Chow</em> dan <em>Uji Hausman</em>, diperoleh model terbaik untuk menganalisis faktor-faktor yang mempengaruhi indeks pembangunan manusia di Provinsi Papua adalah model <em>fixed effect</em> sebagai berikut.</p> <p>Y = 55,47961 - 0,004332X1 + 0,025029X2 + 0,042769X3 dan berdasarkan hasil pengujian signifikansi parameter model regresi diperoleh Laju Pertumbuhan PDRB, Tingkat Kemiskinan dan Rasio Gini mempengaruhi Indeks Pembangunan Manusia di Provinsi Papua.</p> Niswa Nilhaya M. Bobi Frans Kuddi Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 83 94 ANALISIS PEMBENTUKAN PORTOFOLIO OPTIMAL MENGGUNAKAN PENDEKATAN SINGLE INDEX MODEL PADA SAHAM INDEX IDXHIDEV20 https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/162 <p>Investasi dalam saham adalah langkah menyuntikkan modal dengan harapan mendapatkan pengembalian di masa depan, termasuk dividen dan capital gain, sebagai imbalan atas risiko yang diambil pada saat ini. Penting untuk diingat bahwa investasi saham melibatkan risiko, dengan nilai saham yang dapat berfluktuasi bergantung pada faktor-faktor seperti kinerja perusahaan, kondisi pasar, dan situasi ekonomi global. Data survei yang digunakan adalah data historis, dikumpulkan melalui survei internet terhadap harga penutupan saham perusahaan di indeks IDXHIDEV20 dari Januari 2022 hingga Oktober 2023. Portofolio optimal, dalam penelitian ini, memiliki expected return sebesar 9,85%, menunjukkan tingkat pengembalian yang diharapkan dari investasi. Risiko portofolio tersebut sebesar 0,68%, mencerminkan sejauh mana fluktuasi atau volatilitas nilai investasi dalam portofolio tersebut. Dengan risiko yang relatif rendah, portofolio ini dianggap optimal karena mencapai tingkat pengembalian yang tinggi dengan risiko minimal.</p> Shevania Mathelda Ardamis Febryana Dian Hanafi Radian Januari Situmeang Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 95 104 ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT KELUMPUHAN PENDERITA STROKE DENGAN METODE REGRESI LOGISTIK MULTINOMIAL https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/176 <p>Stroke adalah suatu gangguan fungsi otak yang terjadi secara mendadak, disebabkan semata-mata oleh gangguan saraf (deficit neurologis) fokal atau global, yang berlangsung lebih dari 24 jam. Menurut WHO stroke merupakan salah satu dari sepuluh penyakit yang menyebabkan kematian. Di Indonesia sendiri stroke menjadi penyebab 15,4% kematian dari total kasus kematian akibat penyakit. Sebanyak 2,5% dari pasien stroke meninggal dunia dan sisanya akan mengalami kecacatan yang beratnya bervariasi. Penelitian ini dilakukan untuk mengetahui faktor-faktor yang mempengaruhi tingkat kelumpuhan stroke di RSU Haji Surabaya. Dimana faktor-faktor yang mempengaruhi tingkat kelumpuhan stroke pada penelitian ini adalah meliputi jenis kelamin, usia, hipertensi dan diabetes militus. Dari data tersebut akan dilakukan pemodelan terhadap tingkat kelumpuhan stroke beserta faktor-faktor ynag mempengaruhi dengan mengguanakan regresi logistik multinomial.&nbsp; Untuk melihat seberapa berpengaruhnya dari variabel prediktor ini akan diuji baik secara serentak maupun secara parsial. Berdasarkan pengujian tersebut didapatkan kesimpulan bahwa secara serentak keempat variabel prediktor tersebut berpengaruh secara signifikan. Sedangkan berdasarkan pengujian secara parsial variabel yang berpengaruh secar signifikan adalah variabel hipertensi dan variabel diabetes militus. Dari model ynag telah dibuat dapat ditarik kesimpulan bahwa model telah sesuai.</p> Nicea Roona Paranoan Caecilia Bintang Girik Allo Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-06-30 2024-06-30 2 2 105 114 MODELLING SARDINE FISHING IN PAPUA USING COMMON NEAREST NEIGHBOR CLUSTERING https://ejurnal.fmipa.uncen.ac.id/index.php/CJSDS/article/view/202 <p>Papua and Papua Barat provinces, Indonesia, possess a rich marine tapestry woven with the thread of sardine fish, a cornerstone of commercial fisheries. Understanding the spatial distribution of sardine catches is crucial for sustainable resource management and economic development. This study investigates the application of Common Nearest Neighbor Clustering (CNNC) on Sardines catch data from Papua and Papua Barat Province. To address potential multi-collinearity among these attributes, Principal Component Analysis (PCA) was employed as a preprocessing step. The clustering algorithm was optimized with an epsilon parameter of 0.65 and a leaf size of 30, yielding a silhouette score of 0.224373, which indicates moderate clustering quality. The analysis resulted in the identification of seven distinct clusters within the data, providing valuable insights into the distribution and characteristics of Sardines catches across the region. The findings contribute to the understanding of fisheries management in Papua and Papua Barat, with implications for policy and resource allocation. The results of this research contribute to a nuanced understanding of sardine catch distribution in Papua and Papua Barat. By identifying regional clusters, policymakers can tailor fisheries management strategies to specific needs, ensuring the long-term sustainability of this vital resource. Furthermore, the findings provide insights for stakeholders in the fishing industry to optimize operations and enhance economic benefits. This study underscores the importance of spatial analysis in unraveling the complexities of marine ecosystems and supports informed decision-making for the sustainable utilization of marine resources.</p> Aryanto Aryanto Copyright (c) 2024 https://creativecommons.org/licenses/by/4.0 2024-05-31 2024-05-31 2 2