Added P_getopt function prototype to handle various platforms
[dyninst.git] / common / src / linuxKludges.C
1 /*
2  * Copyright (c) 1996 Barton P. Miller
3  * 
4  * We provide the Paradyn Parallel Performance Tools (below
5  * described as Paradyn") on an AS IS basis, and do not warrant its
6  * validity or performance.  We reserve the right to update, modify,
7  * or discontinue this software at any time.  We shall have no
8  * obligation to supply such updates or modifications or any other
9  * form of support to you.
10  * 
11  * This license is for research uses.  For such uses, there is no
12  * charge. We define "research use" to mean you may freely use it
13  * inside your organization for whatever purposes you see fit. But you
14  * may not re-distribute Paradyn or parts of Paradyn, in any form
15  * source or binary (including derivatives), electronic or otherwise,
16  * to any other organization or entity without our permission.
17  * 
18  * (for other uses, please contact us at paradyn@cs.wisc.edu)
19  * 
20  * All warranties, including without limitation, any warranty of
21  * merchantability or fitness for a particular purpose, are hereby
22  * excluded.
23  * 
24  * By your use of Paradyn, you understand and agree that we (or any
25  * other person or entity with proprietary rights in Paradyn) are
26  * under no obligation to provide either maintenance services,
27  * update services, notices of latent defects, or correction of
28  * defects for Paradyn.
29  * 
30  * Even if advised of the possibility of such damages, under no
31  * circumstances shall we (or any other person or entity with
32  * proprietary rights in the software licensed hereunder) be liable
33  * to you or any third party for direct, indirect, or consequential
34  * damages of any character regardless of type of action, including,
35  * without limitation, loss of profits, loss of use, loss of good
36  * will, or computer failure or malfunction.  You agree to indemnify
37  * us (and any other person or entity with proprietary rights in the
38  * software licensed hereunder) for any and all liability it may
39  * incur to third parties resulting from your use of Paradyn.
40  */
41
42 #include "common/h/headers.h"
43
44 typedef int (*intKludge)();
45
46 void * P_memcpy (void *A1, const void *A2, size_t SIZE) {
47   return (memcpy(A1, A2, SIZE));
48 }
49
50 int P_getopt(int argc, char *argv[], const char *optstring)
51 {
52   /* On linux we prepend a + character */
53   char newopt[strlen(optstring)+5];
54   strcpy(newopt, "+");
55   strcat(newopt, optstring);
56   return getopt(argc, argv, newopt);
57 }
58
59 unsigned long long PDYN_div1000(unsigned long long in) {
60    /* Divides by 1000 without an integer division instruction or library call, both of
61     * which are slow.
62     * We do only shifts, adds, and subtracts.
63     *
64     * We divide by 1000 in this way:
65     * multiply by 1/1000, or multiply by (1/1000)*2^30 and then right-shift by 30.
66     * So what is 1/1000 * 2^30?
67     * It is 1,073,742.   (actually this is rounded)
68     * So we can multiply by 1,073,742 and then right-shift by 30 (neat, eh?)
69     *
70     * Now for multiplying by 1,073,742...
71     * 1,073,742 = (1,048,576 + 16384 + 8192 + 512 + 64 + 8 + 4 + 2)
72     * or, slightly optimized:
73     * = (1,048,576 + 16384 + 8192 + 512 + 64 + 16 - 2)
74     * for a total of 8 shifts and 6 add/subs, or 14 operations.
75     *
76     */
77
78    unsigned long long temp = in << 20; // multiply by 1,048,576
79       // beware of overflow; left shift by 20 is quite a lot.
80       // If you know that the input fits in 32 bits (4 billion) then
81       // no problem.  But if it's much bigger then start worrying...
82
83    temp += in << 14; // 16384
84    temp += in << 13; // 8192
85    temp += in << 9;  // 512
86    temp += in << 6;  // 64
87    temp += in << 4;  // 16
88    temp -= in >> 2;  // 2
89
90    return (temp >> 30); // divide by 2^30
91 }
92
93 unsigned long long PDYN_divMillion(unsigned long long in) {
94    /* Divides by 1,000,000 without an integer division instruction or library call,
95     * both of which are slow.
96     * We do only shifts, adds, and subtracts.
97     *
98     * We divide by 1,000,000 in this way:
99     * multiply by 1/1,000,000, or multiply by (1/1,000,000)*2^30 and then right-shift
100     * by 30.  So what is 1/1,000,000 * 2^30?
101     * It is 1,074.   (actually this is rounded)
102     * So we can multiply by 1,074 and then right-shift by 30 (neat, eh?)
103     *
104     * Now for multiplying by 1,074
105     * 1,074 = (1024 + 32 + 16 + 2)
106     * for a total of 4 shifts and 4 add/subs, or 8 operations.
107     *
108     * Note: compare with div1000 -- it's cheaper to divide by a million than
109     *       by a thousand (!)
110     *
111     */
112
113    unsigned long long temp = in << 10; // multiply by 1024
114       // beware of overflow...if the input arg uses more than 52 bits
115       // than start worrying about whether (in << 10) plus the smaller additions
116       // we're gonna do next will fit in 64...
117
118    temp += in << 5; // 32
119    temp += in << 4; // 16
120    temp += in << 1; // 2
121
122    return (temp >> 30); // divide by 2^30
123 }
124
125 unsigned long long PDYN_mulMillion(unsigned long long in) {
126    unsigned long long result = in;
127
128    /* multiply by 125 by multiplying by 128 and subtracting 3x */
129    result = (result << 7) - result - result - result;
130
131    /* multiply by 125 again, for a total of 15625x */
132    result = (result << 7) - result - result - result;
133
134    /* multiply by 64, for a total of 1,000,000x */
135    result <<= 6;
136
137    /* cost was: 3 shifts and 6 subtracts
138     * cost of calling mul1000(mul1000()) would be: 6 shifts and 4 subtracts
139     *
140     * Another algorithm is to multiply by 2^6 and then 5^6.
141     * The former is super-cheap (one shift); the latter is more expensive.
142     * 5^6 = 15625 = 16384 - 512 - 256 + 8 + 1
143     * so multiplying by 5^6 means 4 shift operations and 4 add/sub ops
144     * so multiplying by 1000000 means 5 shift operations and 4 add/sub ops.
145     * That may or may not be cheaper than what we're doing (3 shifts; 6 subtracts);
146     * I'm not sure.  --ari
147     */
148
149    return result;
150 }