Moved P_memcpy to an inline function to support igen changes.
[dyninst.git] / common / src / linuxKludges.C
1 /*
2  * Copyright (c) 1996 Barton P. Miller
3  * 
4  * We provide the Paradyn Parallel Performance Tools (below
5  * described as Paradyn") on an AS IS basis, and do not warrant its
6  * validity or performance.  We reserve the right to update, modify,
7  * or discontinue this software at any time.  We shall have no
8  * obligation to supply such updates or modifications or any other
9  * form of support to you.
10  * 
11  * This license is for research uses.  For such uses, there is no
12  * charge. We define "research use" to mean you may freely use it
13  * inside your organization for whatever purposes you see fit. But you
14  * may not re-distribute Paradyn or parts of Paradyn, in any form
15  * source or binary (including derivatives), electronic or otherwise,
16  * to any other organization or entity without our permission.
17  * 
18  * (for other uses, please contact us at paradyn@cs.wisc.edu)
19  * 
20  * All warranties, including without limitation, any warranty of
21  * merchantability or fitness for a particular purpose, are hereby
22  * excluded.
23  * 
24  * By your use of Paradyn, you understand and agree that we (or any
25  * other person or entity with proprietary rights in Paradyn) are
26  * under no obligation to provide either maintenance services,
27  * update services, notices of latent defects, or correction of
28  * defects for Paradyn.
29  * 
30  * Even if advised of the possibility of such damages, under no
31  * circumstances shall we (or any other person or entity with
32  * proprietary rights in the software licensed hereunder) be liable
33  * to you or any third party for direct, indirect, or consequential
34  * damages of any character regardless of type of action, including,
35  * without limitation, loss of profits, loss of use, loss of good
36  * will, or computer failure or malfunction.  You agree to indemnify
37  * us (and any other person or entity with proprietary rights in the
38  * software licensed hereunder) for any and all liability it may
39  * incur to third parties resulting from your use of Paradyn.
40  */
41
42 #include "common/h/headers.h"
43
44 typedef int (*intKludge)();
45
46 int P_getopt(int argc, char *argv[], const char *optstring)
47 {
48   /* On linux we prepend a + character */
49   char newopt[strlen(optstring)+5];
50   strcpy(newopt, "+");
51   strcat(newopt, optstring);
52   return getopt(argc, argv, newopt);
53 }
54
55 unsigned long long PDYN_div1000(unsigned long long in) {
56    /* Divides by 1000 without an integer division instruction or library call, both of
57     * which are slow.
58     * We do only shifts, adds, and subtracts.
59     *
60     * We divide by 1000 in this way:
61     * multiply by 1/1000, or multiply by (1/1000)*2^30 and then right-shift by 30.
62     * So what is 1/1000 * 2^30?
63     * It is 1,073,742.   (actually this is rounded)
64     * So we can multiply by 1,073,742 and then right-shift by 30 (neat, eh?)
65     *
66     * Now for multiplying by 1,073,742...
67     * 1,073,742 = (1,048,576 + 16384 + 8192 + 512 + 64 + 8 + 4 + 2)
68     * or, slightly optimized:
69     * = (1,048,576 + 16384 + 8192 + 512 + 64 + 16 - 2)
70     * for a total of 8 shifts and 6 add/subs, or 14 operations.
71     *
72     */
73
74    unsigned long long temp = in << 20; // multiply by 1,048,576
75       // beware of overflow; left shift by 20 is quite a lot.
76       // If you know that the input fits in 32 bits (4 billion) then
77       // no problem.  But if it's much bigger then start worrying...
78
79    temp += in << 14; // 16384
80    temp += in << 13; // 8192
81    temp += in << 9;  // 512
82    temp += in << 6;  // 64
83    temp += in << 4;  // 16
84    temp -= in >> 2;  // 2
85
86    return (temp >> 30); // divide by 2^30
87 }
88
89 unsigned long long PDYN_divMillion(unsigned long long in) {
90    /* Divides by 1,000,000 without an integer division instruction or library call,
91     * both of which are slow.
92     * We do only shifts, adds, and subtracts.
93     *
94     * We divide by 1,000,000 in this way:
95     * multiply by 1/1,000,000, or multiply by (1/1,000,000)*2^30 and then right-shift
96     * by 30.  So what is 1/1,000,000 * 2^30?
97     * It is 1,074.   (actually this is rounded)
98     * So we can multiply by 1,074 and then right-shift by 30 (neat, eh?)
99     *
100     * Now for multiplying by 1,074
101     * 1,074 = (1024 + 32 + 16 + 2)
102     * for a total of 4 shifts and 4 add/subs, or 8 operations.
103     *
104     * Note: compare with div1000 -- it's cheaper to divide by a million than
105     *       by a thousand (!)
106     *
107     */
108
109    unsigned long long temp = in << 10; // multiply by 1024
110       // beware of overflow...if the input arg uses more than 52 bits
111       // than start worrying about whether (in << 10) plus the smaller additions
112       // we're gonna do next will fit in 64...
113
114    temp += in << 5; // 32
115    temp += in << 4; // 16
116    temp += in << 1; // 2
117
118    return (temp >> 30); // divide by 2^30
119 }
120
121 unsigned long long PDYN_mulMillion(unsigned long long in) {
122    unsigned long long result = in;
123
124    /* multiply by 125 by multiplying by 128 and subtracting 3x */
125    result = (result << 7) - result - result - result;
126
127    /* multiply by 125 again, for a total of 15625x */
128    result = (result << 7) - result - result - result;
129
130    /* multiply by 64, for a total of 1,000,000x */
131    result <<= 6;
132
133    /* cost was: 3 shifts and 6 subtracts
134     * cost of calling mul1000(mul1000()) would be: 6 shifts and 4 subtracts
135     *
136     * Another algorithm is to multiply by 2^6 and then 5^6.
137     * The former is super-cheap (one shift); the latter is more expensive.
138     * 5^6 = 15625 = 16384 - 512 - 256 + 8 + 1
139     * so multiplying by 5^6 means 4 shift operations and 4 add/sub ops
140     * so multiplying by 1000000 means 5 shift operations and 4 add/sub ops.
141     * That may or may not be cheaper than what we're doing (3 shifts; 6 subtracts);
142     * I'm not sure.  --ari
143     */
144
145    return result;
146 }