Format tunggal-presisi floating-point
format angka komputer yang menempati 4 byte (32 bit) dalam memori
komputer dan merupakan dynamic range yang lebar dari nilai-nilai dengan
menggunakan floating point.
Dalam IEEE 754-2008 basis 2 format 32-bit
secara resmi disebut sebagai binary32. Itu disebut tunggal dalam IEEE
754-1985. Pada komputer lama, format floating-point lain dari 4 byte
yang digunakan.
Salah satu bahasa pemrograman pertama
yang menyediakan tipe data tunggal dan double-presisi floating-point
adalah Fortran. Sebelum adopsi IEEE 754-1985, representasi dan sifat
ganda tipe data float tergantung pada produsen komputer dan model
komputer.
Single-presisi biner floating-point
digunakan karena jangkauan luas atas titik tetap (yang sama-bit lebar),
bahkan jika pada biaya presisi.
Presisi tunggal dikenal sebagai nyata
dalam Fortran, [1] sebagai pelampung di C, C + +, C #, Java [2] dan
Haskell, dan sebagai single di Delphi (Pascal), Visual Basic, dan
MATLAB. Namun, mengambang di Python, Ruby, PHP, dan OCaml dan satu di
versi Oktaf sebelum 3.2 merujuk pada nomor presisi ganda. Dalam
PostScript hanya presisi floating-point tunggal.
Dalam contoh ini:
\ text {} tanda = 0
1 + \ sum_ {i = 1} ^ {23} b_ {23}-i 2 ^ {-i} = 1 + 2 ^ {-2} = 1,25
2 ^ {(e-127)} = 2 ^ {} 124-127 = 2 ^ {-3}
demikian:
\ text {value} = 1,25 \ kali 2 ^ {-3} = 0,15625
Dalam komputasi, presisi ganda adalah
format nomor komputer yang menempati dua lokasi penyimpanan yang
berdekatan dalam memori komputer. Sejumlah presisi ganda, kadang-kadang
hanya disebut ganda, dapat didefinisikan sebagai integer, titik tetap,
atau floating point (dalam hal ini sering disebut sebagai FP64).
Komputer modern dengan lokasi penyimpanan
32-bit menggunakan dua lokasi memori untuk menyimpan nomor presisi
ganda 64-bit (lokasi penyimpanan tunggal dapat menampung sejumlah
presisi tunggal). Presisi ganda floating-point merupakan standar IEEE
754 untuk pengkodean biner atau desimal angka floating-point 64 bit (8
byte).
The presisi ganda biner eksponen
floating-point dikodekan menggunakan representasi offset-biner, dengan
offset nol menjadi 1023, juga dikenal sebagai Bias eksponen dalam
standar IEEE 754. Contoh representasi tersebut akan menjadi:
Emin (1) = -1.022
E (50) = -973
Emax (2046) = 1023
Dengan demikian, seperti yang
didefinisikan oleh representasi offset-biner, untuk mendapatkan eksponen
benar bias eksponen 1023 harus dikurangkan dari eksponen tertulis.
Para eksponen 00016 dan 7ff16 memiliki arti khusus:
00016 digunakan untuk mewakili nol (jika M = 0) dan subnormals (jika M ≠ 0), dan
7ff16 digunakan untuk mewakili ∞ (jika M = 0) dan NaN (jika M ≠ 0),
di mana M adalah mantissa fraksi. Semua pola bit encoding yang valid.
Kecuali untuk pengecualian atas, jumlah presisi ganda seluruh digambarkan oleh:
(-1) ^ {\ Text {tanda}} \ kali 2 ^ {\ text {} eksponen – \ text {eksponen Bias}} \ kali 1 \ text {} mantissa.
Sumber :
Tidak ada komentar:
Posting Komentar